Google 的機器學習技術可以辨識影片中的物體了

在圖像識別的基礎上更進一步。

得益於圖片辨識技術的發展,人們早就可以在網路上實現以圖搜圖的效果。但問題是,那只限於靜止的圖像,畫面一動起來,事情就變得沒那麼簡單了。不過現在,Google 終於在影片識別的領域中找到了突破口,他們日前在 Google Cloud Next '17 的大會上,公佈了一個全新的 API。而它的功能就是透過機器學習技術,在影片裡對以名詞和動詞為關鍵字的影像進行搜尋和辨認。

這個被命名為 Cloud Video Intelligence 的 API,現在仍處於 beta 測試的階段。Google 目前是將其作為一套商用深度學習解決方案,提供給企業整合入 TensorFlow 之類的框架,用來分析儲存的影片和提取 metadata。舉例來說,當你在媒體內容中搜尋「老虎」的時候,就會出現下圖中這樣的結果。


值得一提的是,除了能找出「實體」出現的時間外,CVI 還能偵測到影格間情景的變換。不過使用這個 API 的前提是,你必須將內容存放到 Google Cloud Storage 中,但這應該不算是很大的問題,畢竟像 Apple、Evernote、Spotify 這樣的大公司今年都已經開始使用 Google 的 Cloud 平台了。當然,想在 YouTube 之類的大眾化服務中看到這樣的功能,現在來說估計還為時尚早,但願 Google 不要讓我們等太久吧。

來源: Google Cloud Platform Blog

經由: Engadget, TechCrunch