利用Gemini撰寫Python程式,擷取NotebookLM影片摘要的圖片與文字
作者: 塾長 日期: 2025-11-10 07:42
最近喜歡看把自己的上課資料,經由NotebookLM產生的「影片摘要」,我想將影片的畫面和文字再整理來運用。我把利用Gemini探索的對話歷程加以分享,因為考量到每個人的電腦裡Python執行還境不同,讓有興趣的夥伴可以自己動手試試喔!

以下整理A~G階段的提示詞與回應供大家參考(對話歷程加以分享):※是我自言自語、◎則是與Gemini的互動
※晚上睡前
◎A、首先提出需求:(Gemini回應就已A回應表示)
上傳從觀看者到創造者:解鎖VR與AI的力量.mp4檔案
你是一個專業的影片內容分析師,請將影片轉換為逐頁投影片:
請按照以下步驟處理:
1. 分析影片內容結構,識別主要段落和重點
2. 擷取關鍵畫面作為投影片視覺素材
3. 為每個關鍵畫面撰寫簡潔的說明文字
4. 組織成邏輯連貫的投影片序列
投影片格式要求:
- 總頁數:8-15頁
- 每頁包含:標題、關鍵畫面、重點說明
- 語言:中文
- 風格:專業簡潔
◎A回應:
1.影片分析投影片:從觀看者到創造者:解鎖VR與AI的力量
(略)提供各頁解析標題、重點說明,但關鍵畫面只以間點與文字簡述。
另外,我順手將結果也建立一份資訊圖表展現
◎B、各頁畫面可否擷取出來?
◎B回應:
我無法直接將影片畫面擷取為獨立的圖片檔案。
不過,我在分析時所參考的關鍵畫面時間點如下,您可以在影片 從觀看者到創造者:解鎖VR與AI的力量.mp4 中找到它們:
(略)條列個關鍵畫面與時間點。

※第二天一早想到....
◎C、我們可以改用Python 來寫嗎?我把影片檔放資料夾中,程式分析重要畫面,建立jpg 或png圖檔,另外還有txt逐字稿。
◎C回應:
這是一個很棒的想法!我們可以透過 Python 來自動化處理這個任務。(略)
我可以為您產生一個完整的 Python 專案,您只需要在您的電腦上設定好環境並執行它。我將為您產生三個檔案:
video_analyzer.py:這是核心的 Python 程式,它會執行所有的分析工作。
requirements.txt:這是一個文字檔,列出了執行此程式所需的所有 Python 函式庫。
README.md:一份完整的中文說明書,指導您如何設定環境並執行程式。

◎C.1、依據說明執行後,出現錯誤訊息,就把訊息複製貼回來再問。
OSError: [WinError 1114] 動態連結程式庫 (DLL) 初始化例行程序失敗。 Error loading "C:UsersuserAppDataLocalProgramsPythonPython313Libsite-packages orchlibc10.dll" or one of its dependencies.
C.1回應:
您看到的錯誤 Error loading ... c10.dll 是 PyTorch (torch) 函式庫在試圖載入其核心 DLL 檔案時發生的。openai-whisper 函式庫依賴 torch 來運作,所以 import whisper 時會觸發這個問題。
根本原因 問題的根本原因是您目前使用的 Python 3.13 版本。
※以下是處理個人電腦環境的依引導進行,各種版本與元件,大家或有不同喔!
◎C.2 依據引導操作,再貼問「No suitable Python runtime found」
C.2回應:
解決方案:安裝 Python 3.11 您需要手動下載並安裝 Python 3.11。請依照以下步驟操作:(略)
◎C.3 還是未成功「OSError: [WinError 1114] 動態連結程式庫 (DLL) 初始化例行程序失敗。 Error」(略)
C.3回應:
您好,這個錯誤 [WinError 1114] 確實很棘手。
恭喜您!您已經成功建立了虛擬環境 .venv (我們從錯誤路徑 .venvLibsite-packages... 中可以看到),並且也使用了正確的 Python 3.11 版本。現在的問題不再是 Python 版本,而是 PyTorch (torch) 函式庫本身

※經過幾回後,終於成功了!所以我想再改程式。
※給讀者建議:若您要試試時,可以從C步驟直接開始:我想撰寫用Python程式,把影片檔放資料夾中,程式分析重要畫面,建立jpg 或png圖檔,另外還有txt逐字稿。
◎D、太開心、成功了!可否幫我改寫:運用在自己提供的mp4影片上,而且沒有事先分析關鍵時間點與畫面的數據?
◎D回應:改寫程式(略)
撰寫心程式後,以後自己更改程式中影片名稱即可。
VIDEO_FILE = "從觀看者到創造者:解鎖VR與AI的力量.mp4"(# !!! 請將您要分析的影片檔名填寫在這裡 !!!)

◎E、對了,文字檔也很完整,但...,可以加上標點符號嗎?
◎E回應:(略)處理完成

※以下是自己搞烏龍...,因為寫好的python程式改名字了....Gemini還不失禮貌地提醒我,哈哈!
◎F、(.venv) C:UsersuserDesktopVideoProject>python video_analyzer.py
◎F回應:
您好,看到這個錯誤了! [Errno 2] No such file or directory
這個錯誤的意思非常單純:您要執行的檔案名稱打錯了,或者該檔案不存在於您目前的資料夾中。

※最後一步驟,也是這次文章裡的附圖,我也很喜歡!
◎G、我發現:咱們這次的對話,不也是一次人機互動的最適流程演示嗎?你能否將這次歷程做成一頁式動畫,讓每個流程可以展現進度與改善的重點,提供使用者點選按鈕後進入各階段,就好像看見咱們這次全互動的美好再現?好期待啊!
◎G回應:(略)完成一頁式互動網頁 (SPA),包含6頁步驟圖。
訂閱
上一篇
返回
下一篇

標籤:


Gemini深度研究「展會分析與產業創新建議」 (2025-11-02 09:42)
展望台灣智慧教育新藍圖(一)~以85届中国教育装備展資料為參考之例 (2025-10-27 09:21)
建立「主題研究報告章節規劃與提示詞公式設計」Gem (2025-10-26 14:44)
分享Gemini對話「014w_文獻分析專家工作流程與實例」 (2025-10-26 14:03)
關於Gemini對話紀錄的整理與期待 (2025-10-24 08:21)
在 Google 簡報插入 Google 相簿相片 (2025-10-13 19:19)
回顧與Gemini協作的美妙歷程提示詞 (2025-10-12 19:32)
Google AI 三寶陪你一起研究! (2025-10-10 10:09)
兩項工作流思行分享 (2025-10-04 17:18)