一般問題

問:什麼是 Amazon Rekognition?

Amazon Rekognition 是可讓您輕鬆將強大的視覺分析新增到應用程式的服務。Rekognition Image 可讓您建立功能強大的應用程式,用於搜尋、驗證和組織數百萬個影像。Rekognition Video 可從存放或即時串流的影片擷取動態內容,以協助您進行分析。

Rekognition Image 是一種影像辨識服務,可偵測物件、場景、活動、地標、臉部、主色和影像品質。Rekognition Image 也會擷取文字、辨識名人,以及辨識影像中的不當內容。它還能讓您搜尋及比對人臉。

Rekognition Video 是一種影片辨識服務,可在 Amazon S3 存放的影片和即時影片串流中偵測活動,了解畫面中人們的移動情況,以及辨識物件、名人和不當內容。即使看不清楚臉部,或整個人不斷進出場景,Rekognition Video 也能在影片中偵測人物並進行追蹤。例如,您可以在應用程式使用此功能,當有人送包裹到家時傳送即時通知。Rekognition Video 還可讓您建立中繼資料索引,例如物件、活動、場景、地標、名人和臉孔,讓搜尋影片變得更加容易。

問:什麼是深度學習?

深度學習是機器學習的子領域,也是人工智慧的重要分支。深度學習的目標是透過深度圖和由多個線性與非線性轉換組成的處理層,從原始資料推斷出高階的抽象概念。深度學習大致上是依據人腦處理資訊和進行溝通的模式為基礎。深度學習取代了手動操作的功能,轉而從非常大量的註釋資料中學習。系統會透過高效的演算法反覆估算深度圖中數十萬個參數進行學習。

深度卷積神經網路 (CNN) 以及遞歸神經網路等數種深度學習架構,都已經應用在電腦視覺、語音辨識、自然語言處理、音頻辨識領域,在多種任務中獲得尖端成果。

Amazon Rekognition 屬於 Amazon 人工智慧系列服務。Amazon 人工智慧服務利用深度學習理解影像、將文字轉成維妙維肖的語音,以及建立直覺易用的對話式文字和語言介面。

問:是否必須具備深度學習的專業知識才能使用 Amazon Rekognition?

不,使用 Amazon Rekognition 不必建置、維護或升級深度學習管道。

為了讓複雜的電腦視覺任務 (例如物件和場景偵測、臉部分析、臉部辨識) 結果更加準確,深度學習系統必須利用大量有標籤的基本事實資料進行適當的調校和訓練。取得資料、清理資料,以及正確地標記資料,都是耗時且成本高昂的任務。此外,訓練深度神經網路的運算成本極高,而且通常必須使用圖形處理器 (GPU) 建置自訂硬體。

Amazon Rekognition 是全受管的服務,已預先完成影像和影片辨識任務的訓練,所以您不必再花費時間和資源建立深度學習管道。Amazon Rekognition 會利用最新的研究成果以及新取得的訓練資料,持續提高模型的準確性。因此,您只須專注於進行高價值的應用程式設計與開發。

問:Amazon Rekognition 有哪些最常見的使用案例?

Rekognition Image 最常見的使用案例包括:

  • 可搜尋的影像庫
  • 以臉部為基礎的使用者驗證
  • 情緒分析
  • 臉部辨識
  • 影像仲裁

Rekognition Video 最常見的使用案例包括:

  • 影片存檔的搜尋索引
  • 輕鬆篩除影片中露骨和暗示性內容

問:如何開始使用 Amazon Rekognition?

若您尚未註冊 Amazon Rekognition,可以按一下 Amazon Rekognition 頁面上的「試用 Amazon Rekognition」按鈕,完成註冊程序。您必須擁有 Amazon Web Services 帳戶;若您尚未擁有帳戶,註冊過程中會提示您建立一個帳戶。註冊完成後,請透過 Amazon Rekognition 管理主控台,使用您自己的圖片和影片試用 Amazon Rekognition,或下載 Amazon Rekognition SDK 開始建立自己的應用程式。如需詳細資訊,請參閱我們提供逐步操作的入門指南

問:Amazon Rekognition 支援哪些圖片和影片格式?

Amazon Rekognition Image 目前支援 JPEG 和 PNG 影像格式。您所提交的影像可以是 S3 物件或是位元組陣列。Amazon Rekognition Video 操作可以分析存放在 Amazon S3 儲存貯體的影片。影片必須使用 H.264 解碼器編碼。支援的檔案格式為 MPEG-4 和 MOV。解碼器是一種軟體或硬體,可壓縮資料加快交付速度,然後將收到的資料解壓縮成原始格式。H.264 解碼器常用於錄製、壓縮及分發影片內容。影片檔案格式可能包含一或多個解碼器。如果您的 MOV 或 MPEG-4 格式影片檔案無法在 Rekognition Video 使用,請確認影片編碼所用的解碼器為 H.264。

問:Amazon Rekognition 支援多大的檔案?

若您提交的是 S3 物件,Amazon Rekognition Image 支援最大 15 MB 的影像檔案大小,若是影像位元組陣列,則最大 5 MB。以 S3 檔案的形式傳送時,Amazon Rekognition Video 支援最大 10 GB 的檔案,以及最長 6 小時的影片。

問:圖片解析度對於 Rekognition Image API 產生的品質有什麼影響?

Amazon Rekognition 接受各種影像解析度。若希望獲得最佳結果,我們建議使用 VGA (640x480) 以上的解析度。雖然 Amazon Rekognition 接受兩個維度都至少有 80 個像素的影像,但是 QVGA (320x240) 以下的解析度比較可能會遺漏一些臉孔、物件或不適當的內容。

問:Amazon Rekognition Image 能偵測和分析到多小的物件?

實用的估算方法是先找出影像中出現的最小物件或人臉,然後確認其大小 (以像素為單位) 至少達較短影像維度的 5%。舉例來說,若您正在處理 1600x900 的影像,最小的人臉或物件在任一維度都必須至少有 45 個像素。

問:如何對 Amazon Rekognition 預測進行人工審查?

Amazon Rekognition 直接與 Amazon 增強版 AI (Amazon A2I) 整合,因此您可以輕鬆地將低可信度預測從 Amazon Rekognition Image 傳遞給人工審查者。使用 Amazon Rekognition API 進行內容仲裁或 Amazon A2I 主控台,您可以指定 Amazon A2I 將預測路由給審查者的條件,該條件可以是可信度閾值或隨機取樣百分比。若指定信賴度閾值,則 Amazon A2I 僅路由傳送那些低於人工審查閾值的預測。您可以隨時調整這些閾值,以在準確性和成本效益之間達到適當的平衡。或者,若您指定取樣百分比,則 Amazon A2I 會路由傳送預測的隨機範本進行人工審查。這可協助您實作稽核,以定期監控預測的準確性。Amazon A2I 還為審查者提供一個 Web 界面,其中包含完成審查任務所需的一切說明和工具。有關使用 Amazon Rekognition 實作人工審查的更多資訊,請參閱 Amazon A2I 網頁

問:影片解析度對於 Rekognition Video API 產生的品質有什麼影響?

系統已經過訓練,可辨識大於 32 像素 (最短尺寸) 的人臉,也就是說可辨識的人臉大小下限介於約 QVGA 解析度較小螢幕的 1/7 到 HD 1080p 解析度的 1/30。例如,使用 VGA 解析度時,如果人臉小於較小銀幕的 1/10,則使用者應預期會有效能降低的狀況。

問:還有哪些因素會影響 Rekognition Video API 的品質?

除了影片解析度,過於模糊、人物快速移動和光線條件、姿態也會影響 API 的品質。

問:哪些使用者影片內容適合 Rekognition Video API?

此 API 最適合與在一般顏色和光線條件下從正面拍攝的消費者和專業影片搭配使用。此 API 並未針對黑白、IR 或極端的光線條件進行測試。對錯誤警示敏感的應用程式,我們建議捨棄可信度分數低於指定之 (應用程式專屬) 可信度分數的輸出內容。

問:哪些 AWS 區域可以使用 Amazon Rekognition?

如需提供 Amazon Rekognition 的所有區域清單,請參閱 AWS 區域表

標籤偵測

問:什麼是標籤?

標籤是指影像中的一個物件、場景或概念,根據影像的內容決定。例如,一張照片中有一個人在熱帶海灘上,包含的標籤可能就有「人」、「水」、「沙」、「棕櫚樹」、「泳裝」(物件)、「海灘」(場景)、「戶外」(概念)。 

問:什麼是可信度分數?該如何使用?

可信度分數介於 0 至 100 之間,用來表示特定預測結果的正確機率。以剛才的熱帶海灘照片為例,如果物件和場景偵測程序給予「水」標籤的可信度分數是 99,「棕櫚樹」標籤的可信度分數是 35,那麼影像中就比較可能有水而不是棕櫚樹。

應用程式對於偵測錯誤 (錯誤肯定) 若是較為敏感,可信度分數低於特定閾值時便應捨棄結果。最佳閾值視應用程式而定。在許多情況中,最低可信度數值若高於預設值,就能達成最佳的使用者體驗。

問:什麼是物件和場景偵測?

物件和場景偵測是指分析影像或影片,並根據其中的視覺內容指派標籤的程序。Amazon Rekognition Image 是利用 DetectLabels API 完成操作。 這個 API 會自動識別數千個物件、場景、概念,然後回傳每個標籤的可信度分數。DetectLabels 使用的預設可信度閾值是 50。物件和場景偵測最適合想要搜尋和整理大型影像庫的客戶,包括依靠使用者產生內容的消費型和生活型應用程式,以及想要改善目標投放演算法的廣告科技公司。

問:Amazon Rekognition 是否可以偵測物件位置並傳回週框方塊?

是,Amazon Rekognition 可以偵測影像和視訊中的「人」、「汽車」、「槍枝」或「狗」之類的許多常見物件。您可以取得所找到物件的每個執行個體的週框矩形座標以及可信度分數。如需物件週框方塊的 API 回應結構的詳細資訊,請參閱文件

問:Amazon Rekognition 是否提供有關偵測到的標籤之間的關係的資訊?

是的,針對找到的每個標籤,Amazon Rekognition 都會傳回其父項、別名和類別 (如果存在)。在「parents」(父項) 欄位中會依階層順序傳回父項。第一個父項標籤是直屬父項,而以下標籤是父項的父項。例如,在辨識「汽車」時,Amazon Rekognition 會傳回父項標籤「車輛」(父項) 和「運輸」(父項的父項)。別名是與主要標籤具有相同含義的標籤,並在「aliases」(別名) 欄位中傳回。例如,由於「手機」是「行動電話」的別名,因此 Amazon Rekognition 會在「行動電話」標籤的「aliases」(別名) 欄位中傳回「手機」。類別根據一般主題分組標籤,並在「categories」(類別) 欄位中傳回。例如,由於「狗」是「動物和寵物」類別下的標籤,因此 Amazon Rekognition 會在「狗」標籤的「categories」(類別) 欄位中傳回「動物與寵物」。如需支援標籤及其分類的完整清單的詳細資訊,請參閱 Amazon Rekognition 標籤偵測文件

問:Amazon Rekognition 支援哪些類型的標籤?

Rekognition 支援數千種屬於常見類別的標籤,但不限於此:

  • 人物與活動:「婚禮」、「新娘」、「嬰兒」、「生日蛋糕」、「吉他手」等
  • 食品與飲料:「蘋果」、「三明治」、「紅酒」、「蛋糕」、「披薩」等
  • 自然與戶外:「海灘」、「山脈」、「湖泊」、「夕陽」、「彩虹」等
  • 動物與寵物:「狗」、「貓」、「馬」、「老虎」、「烏龜」等
  • 住家與庭園:「床」、「桌子」、「後院」、「吊燈」、「寢室」等
  • 運動與休閒:「高爾夫球」、「棒球」、「曲棍球」、「網球」、「健行」等
  • 植物與花卉:「玫瑰」、「鬱金香」、「棕櫚樹」、「森林」、「竹子」等
  • 藝術與娛樂:「雕塑」、「繪畫」、「吉他」、「芭蕾」、「馬賽克」等
  • 運輸與交通工具:「飛機」、「汽車」、「自行車」、「摩托車」、「卡車」等
  • 電子裝置:「Computer」(電腦)、「Mobile Phone」(行動電話)、「Video Camera」(攝影機)、「TV」(電視)、「Headphones」(耳機) 等。
  • 地標:「Brooklyn Bridge」(布魯克林大橋)、「Colosseum」(羅馬競技場)、「Eiffel Tower」(艾菲爾鐵塔)、「Machu Picchu」(馬丘比丘)、「Taj Mahal」(泰姬瑪哈陵) 等。

問:物件與場景偵測和影片分析有何不同?

Rekognition Video 可讓您自動識別數千種物件 (例如汽車或寵物) 和活動 (例如慶祝或跳舞),並針對每個標籤提供時間戳記和可信度分數。它也倚賴影片中的動作和時間內容,正確地識別複雜的活動,例如「吹蠟燭」或「滅火」。

問:我找不到所需的標籤。如何請求新標籤?

請透過 Amazon Rekognition 主控台將標籤請求傳送給我們,方法是在「Search all labels」(搜尋所有標籤) 區段的輸入欄位中輸入標籤名稱,然後按一下「Request Rekognition to detect」(請求 Rekognition 偵測) 請求的標籤。Amazon Rekognition 會根據客戶回饋持續擴增標籤型錄。

問:什麼是 Image Properties (影像屬性)?

影像屬性是 Amazon Rekognition Image 的一項功能,可偵測主色和影像品質。影像屬性會偵測整個影像、影像前景、影像背景,以及具有本地化週框方塊的物件的主色。影像屬性也會透過亮度、清晰度和對比分數來測量影像品質。可以使用 IMAGE_PROPERTIES 作為輸入參數,透過 DetectLabels API 叫用影像屬性,且可使用或不使用用於標籤偵測的 GENERAL_LABEL 輸入參數。若要進一步了解,請瀏覽 Amazon Rekognition 標籤偵測文件

問:主色是如何判斷的?

影像屬性返回四種格式的主色:RGB、十六進位碼、CSS 顏色和簡化顏色。Amazon Rekognition 首先按像素百分比辨識主色,然後將這些顏色對應至 140 色 CSS 調色盤、RGB、十六進位碼和 12 種簡化顏色 (即「綠色」、「粉紅色」、「黑色」、「紅色」、「黃色」、「青色」、「棕色」、「橘色」、「白色」、「紫色」、「藍色」、「灰色」)。依照預設,影像屬性會傳回 10 種主色,除非客戶指定要傳回的顏色數量。API 可傳回的主色數量上限為 12 種。

問:如何解讀亮度、清晰度和對比度分數?

影像屬性為每個亮度、清晰度和對比度分數提供 0 到 100 的值。例如,曝光不足的影像會傳回較低的亮度分數,而明亮的影像則會傳回較高的亮度分數。

問:如何檢查 Amazon Rekognition 是否已更新模型?

Amazon Rekognition 會傳回 LabelModelVersion 參數,讓您了解是否已更新模型。物件和場景偵測模型會經常根據客戶意見回饋更新。

Amazon Rekognition 自訂標籤

問:是否可以使用自訂標籤來分析臉部、自訂文字偵測?

否。自訂標籤用於在影像中查找物件和場景。自訂標籤不可用於分析臉部、自訂文字偵測。您應該在這些任務中使用其他 Rekognition API。請參閱有關臉部分析、文字偵測的文件。

問:是否可以使用自訂標籤尋找不安全的影像內容?

是。自訂標籤用於在影像中尋找物件和場景。自訂標籤經過訓練,以偵測使用案例特定的不安全影像內容,可以針對您的使用案例偵測不安全的影像內容。另請參閱審核 API 文件,以偵測一般的不安全影像內容。

問:訓練自訂模型需要多少張影像?

訓練自訂模型所需的影像數量取決於您希望模型預測的自訂標籤的變化性,以及訓練資料的品質。例如,對於影像上的獨特標誌,使用 1-2 張訓練影像即可,而對於存在許多變化 (比例、視點、變形) 的更細微的標誌,可能需要數十到數百個具有高品質註解的樣本。如果您已經有大量帶標籤的影像,我們建議使用盡可能多的影像來訓練模型。有關最大訓練資料集大小的限制,請參閱文件。

儘管有時可能需要數百張影像來訓練高精度的自訂模型,但是使用「自訂標籤」,您可以首先針對每個標籤使用數十張影像訓練模型,查看測試結果以了解哪些地方有待改進,並相應地增加新的訓練影像再次進行訓練,如此反覆進行,最終提升模型品質。

問:我應該為自訂模型佈建多少推論運算資源?

所需的平行推論運算資源的數量取決於您在給定的時間點需要處理多少張影像。單個資源的輸送量將取決於多種因素,包括影像的大小、複雜性 (可見的偵測對像數量) 以及自訂模型的複雜性。我們建議您監控需要為自訂模型佈建資源的頻率,以及一次需要處理的影像數量,以便最高效地計劃自訂模型的佈建。
如果您希望週期性地處理影像 (例如,每天或每週處理一次,或在一天中的排程次數),則您應該在計劃的時間佈建為自訂模型自訂資源、處理所有影像,然後取消佈建。如果您不取消佈建,即使沒有在處理影像也要付費。

問:我的訓練失敗了。我需要付費嗎?

不需要。如果訓練失敗,您將不需要為運算資源付費。

內容審核

問︰什麼是內容審核?

Amazon Rekognition 的內容審核 API 使用深度學習來偵測露骨或暗示性成人內容、暴力內容、武器、視覺干擾內容、毒品、酒、煙草、仇恨符號、賭博以及影像和影片中粗魯的手勢。除了根據出現的不當或冒犯性內容來標記影像或影片以外,Amazon Rekognition 還會傳回內含可信度分數的階層式標籤清單。這些標籤會指出偵測到的內容類型的子類別,因此能讓開發人員更精準地篩選和管理大量使用者產生的內容 (UGC)。這個 API 可用於應用程式的仲裁工作流程,例如社交和約會網站、相片分享平台、部落格和論壇、適合兒童的應用程式、電子商務網站、娛樂和線上廣告服務等等。

問:Amazon Rekognition 偵測哪類不當、冒犯性和不需要的內容?

您可以在此處找到 Amazon Rekognition 偵測的內容類別完整清單。

Amazon Rekognition 會傳回階層式標籤,而每個偵測到的標籤會有可信度分數。例如,假設有一個不適當的影像,Rekognition 可能傳回「露骨的裸露」連同一個可信度分數做為最上層標籤。例如,若標記所有類型的顯式成人內容,開發人員可以使用此中繼資料以高級別標記內容。在同一個回應中,Rekognition 也會提供其他內容 (如「男性裸露圖片」) 連同它自己的可信度分數,傳回第二層的精細度。開發人員可利用此資訊來建立更複雜的篩選邏輯,以為不同的地理位置和人口統計提供服務。

請注意,內容審核 API 無權也無意成為不當和冒犯性內容的全面篩選機制。不僅如此,不安全影像偵測 API 也不會偵測影像中是否包含違法內容 (例如兒童性虐待素材) 或不正常的成人內容。

如果您需要在影像中偵測其他的不當內容類型,請透過本節後面所述的回饋程序與我們聯繫。

問:如何知道目前使用的模型版本為何?

Amazon Rekognition 會定期改進模型。要追蹤模型版本,您可以在 API 回應中使用 'ModerationModelVersion' 欄位。

問:如何確保 Amazon Rekognition 符合我的影像或影片審核使用案例的準確性目標?

Amazon Rekognition 的內容審核模型已經過廣泛地微調和測試,但是我們建議您在自己的資料集上測定正確性以測量效能。

您可以在 API 請求中使用 'MinConfidence' 參數,以便在內容偵測 (召回率) 與偵測正確性 (準確度) 取得平衡。如果您降低 'MinConfidence',可能會偵測到大部分的不當內容,但也可能挑出實際上並非不當內容。如果您提高 'MinConfidence',則比較能夠確保所偵測到的確實是不當內容,卻可能無法標記到某些內容。

問:如何提供意見回饋給 Rekognition 以改進其內容審核 API?

請透過 AWS 客戶支援向我們提出您的要求。Amazon Rekognition 會根據客戶回饋持續擴增偵測的不當內容類型。請注意,這個程序不接受違法內容 (例如兒童性虐待素材)。

臉部分析

問:什麼是臉部分析?

臉部分析是指偵測影像中的人臉,並從中擷取相關的臉部屬性。Amazon Rekognition Image 會傳回在影像中偵測到的每一張臉的週框方塊,內含諸如性別、是否戴著墨鏡、人臉特徵點等屬性。Rekognition Video 會傳回在影片中偵測到的臉孔以及對應的時間戳記,加上每個偵測到的臉的位置及內含人臉特徵點的週框方塊。

問:我可以從 Amazon Rekognition 取得哪些臉部屬性?

Amazon Rekognition 偵測到的每張人臉都會回傳下列臉部屬性、一個週框方塊,和每個屬性的可信度分數:

  • 性別
  • 微笑
  • 情緒
  • 眼鏡
  • 墨鏡
  • 眼睛睜開
  • 嘴巴張開
  • 八字鬍
  • 山羊鬍
  • 姿態
  • 品質
  • 臉部特徵點

問:什麼是臉部姿態?

臉部姿態是指偵測到的人臉依俯仰軸、翻滾軸、偏擺軸旋轉的結果。上述每個參數都會回傳介於 -180 至 +180 度之間的一個角度。臉部姿態可用於找出人臉多邊形週框方塊的方向 (相對於矩形週框方塊)、量測變形程度、準確追蹤人臉等。

問:什麼是臉部品質?

臉部品質利用兩種參數描述偵測到的人臉影像:清晰度和亮度。兩項參數都會回傳介於 0 與 1 之間的數值。這些參數可以套用閾值,篩選出光線良好的清晰臉孔。對於臉部比較和臉部辨識這類需要高品質臉部影像的應用程式,這項功能十分實用。

問:什麼是臉部特徵點?

臉部特徵點是一組凸起點,通常位在重要人臉部位,例如眼睛、鼻子、嘴巴的邊角、頂點或中間點。Amazon Rekognition DetectFaces API 會回傳一組臉部特徵點,可用來裁切臉部、將一張臉孔變換成另一張、重疊自訂遮罩以建立自訂篩選條件等等。

問:一個影像中可以偵測到多少臉孔?

使用 Amazon Rekognition 可以在一個影像中偵測到最多 100 張臉孔。

問:臉部分析與影片分析有何不同?

使用 Rekognition Video,您可以尋找影片中的臉部並分析臉部屬性,例如是否正在微笑或是眼睛是否睜開,或是否面露情緒。Rekognition Video 會傳回偵測到的臉孔以及對應的時間戳記,加上每個偵測到的臉的位置及內含諸如左眼、右眼、鼻子、左嘴角與右嘴角等人臉特徵點的週框方塊。這項位置及時間資訊可用於輕鬆追蹤使用者在一段時間內的情緒變化及提供額外功能,像是自動臉部框、反白或裁剪等。影片分析不支援使用者搜尋。

問:除了影片解析度,還有哪些因素會影響 Rekognition Video API 的品質?

除了影片解析度以外,畫質和臉孔的呈現方式、搜尋的人臉集合部分等也會造成很大的影響。針對每個人使用多種不同的臉部執行個體,像是鬍子、眼睛、姿勢 (側面和正面),這些都能大幅提高效能。一般來說,快速移動的人物會降低品質。此外,模糊的影片也會降低品質。

臉部比較

問:什麼是臉部比較?

臉部比較是比較兩張臉孔或是更多臉孔,以量測相似度的程序。Amazon Rekognition Image 使用 CompareFaces API,可量測兩個影像中的臉孔屬於同一個人的可能性。API 將原始輸入影像中的臉孔比對目標輸入影像中偵測到的每個臉孔,並針對每個比對結果回傳相似度分數。所偵測到的每張臉孔也會回傳臉部週框方塊和可信度分數。您可以利用臉部比較功能,近乎即時地利用某個人在檔案上的員工照片驗證其身分。

問:我使用的原始影像是否可以包含超過一張臉孔? 

是。如果原始影像含有多張臉孔,CompareFaces 會偵測最大的臉孔,使用它與目標影像中偵測到的每個臉孔進行比對。

問:我可以比對多少張臉孔?

您可以利用原始影像的一張臉孔,和目標影像中偵測到的最多 15 張臉孔進行比對。

問:什麼是臉孔搜尋?

臉孔搜尋是使用輸入的臉孔來搜尋已儲存臉孔集合中類似相符項目的過程。利用臉孔搜尋可以輕鬆建構多種應用程式,例如銀行付款的多重驗證、自動允許員工進入建築物等等。

問:什麼是臉孔集合?如何建立?

臉孔集合是您可搜尋的臉孔向量索引,它們是臉孔的數學表示法。Rekognition 不會將臉孔影像儲存在您的集合中。使用 CreateCollection API 便可以在支援的 AWS 區域中輕鬆建立一個臉孔集合,並獲得一個 Amazon Resource Name (ARN)。每一個臉孔集合都有一個獨一無二的關聯 CollectionId。

問:如何將臉部新增至集合以進行搜尋?

若要在現有臉孔集合中新增一張臉孔,請使用 IndexFaces API。這個 API 會以 S3 物件或影像位元組陣列的形式接受一個影像,然後將偵測到的臉孔向量表示新增到人臉集合。針對每一個新增的臉孔向量,IndexFaces 也會回傳獨有的 FaceId 和臉孔週框方塊。

可以彙總同一個人的多個臉孔向量,使用 CreateUser 和 AssociateFaces API 來建立和儲存使用者向量。使用者向量是比單個臉孔向量更強大的表示法,因為它們包含具有不同程度照明、清晰度、姿勢、外觀差異等方面的多個臉孔向量。與使用單個臉孔向量的臉孔搜尋相比,透過使用者向量進行臉部搜尋可以顯著提高準確性。使用者向量與關聯的臉孔向量儲存在相同的集合中。

問:如何從集合中刪除臉孔?

若要在現有的臉孔集合中刪除一張臉孔,請使用 DeleteFaces API。這個 API 會在所提供的人臉集合上運作 (使用 CollectionId),把 FaceID 列表上相對應的項目移除。如果 FaceID 與使用者向量相關聯,您首先需要使用 DisassociateFaces API 呼叫將其從使用者向量中移除。或者,您也可以使用 DeleteUser API,從集合中刪除使用者向量。

如需有關新增和刪除臉孔的詳細資訊,請參閱管理集合範例。

問:我如何在臉孔集合中搜尋使用者?

一旦建立使用者和相關的 FaceID,您就可以使用影像 (SearchUsersByImage)、UserId (SearchUsers) 或 FaceID (SearchUsers) 進行搜尋。這些 API 每取得一張輸入臉孔,便會回傳一組符合條件的使用者,依相似度分數排列,相似度最高在最前面。如需更多詳細資訊,請參閱我們的搜尋使用者範例。

問:我如何在人臉集合中搜尋一張臉孔?

在您建立有索引的臉部集合後,您可以使用一個影像 (SearchFaceByImage) 或一個 FaceId (SearchFaces) 在其中搜尋臉孔。這些 API 每取得一張輸入臉孔,便會回傳一組符合條件的臉孔,依相似度分數排列,相似度最高在最前面。如需更多詳細資訊,請參閱我們的搜尋臉孔範例。

問:臉孔搜尋與影片分析有何不同?

Rekognition Video 可讓您對內含數千萬張人臉的集合執行即時臉部搜尋。首先,建立可存放多個臉部的臉部集合,臉部指的是臉部特徵的向量表示法。Rekognition 接著會搜尋人臉集合在影片中找出視覺上相似的臉孔。Rekognition 會傳回影片中每張臉孔的可信度分數,以便您在應用程式中顯示可能相符的比對結果。影片分析不支援使用者搜尋。

問:除了影片解析度,還有哪些因素會影響 Video API 的品質?

除了影片解析度以外,畫質和臉孔的呈現方式、搜尋的人臉集合部分等也會造成很大的影響。針對每個人使用多種不同的臉部執行個體,像是鬍子、眼睛、姿勢 (側面和正面),這些都能大幅提高效能。一般來說,快速移動的人物會降低品質。此外,模糊的影片也會降低品質。

名人辨識

問:什麼是名人辨識?

Amazon Rekognition 的名人辨識功能是一個以深度學習為基礎的易用 API,可用於偵測和識別在其領域中有名、值得注意或表現傑出的人士。RecognizeCelebrities API 的建置目的是要大規模的操作,而且能夠識別多種類別的名人,像是政治、運動、商業、娛樂和媒體。如果客戶需要在數位影像庫索引和搜尋特別感興趣的名人,則我們的名人辨識功能非常實用。

問:名人辨識 API 可識別哪些人?

Amazon Rekognition 只能識別已訓練深度學習模型加以辨識的名人。請注意,RecognizeCelebrities API 無權也從未表明會提供名人的完整清單。此功能旨在根據我們客戶的需求和回饋,盡可能包含最多的名人。我們會持續增加新的名人,對於名人辨識功能無法辨識可能被其他團體或我們客戶視為傑出的個人,這種情況並不代表我們對該名人的評價。如果您希望名人辨識功能可以識別其他名人,請提交回饋。

問:可透過 Amazon Rekognition API 識別的名人是否可請求從此功能移除?

是。如果某位名人希望從此功能移除,可傳送電子郵件到 AWS 客戶支援,我們將處理移除請求。

問:可透過哪些來源提供關於名人的額外資訊?

API 支援選用的來源清單,以提供關於名人的額外資訊做為 API 回應的一部分。我們目前提供 IMDB URL (可用時)。之後可能會增加其他來源。

問:名人辨識和影片分析有何不同?

使用 Rekognition Video,您可以偵測及辨識名人出現在影片中的時間和地點。含時間編碼的輸出內容包括名人的姓名和唯一 ID、週框方塊座標、可信度分數以及指向該名人相關內容的 URL,例如,名人的 IMDB 連結。即使影片中的臉孔有時被擋到,仍然可以偵測名人。這項功能可讓您製作索引及搜尋數位影片資料庫,找出與特定行銷和媒體需求相關的使用案例。

問:除了影片解析度,還有哪些因素會影響 Rekognition Video API 的品質? 

快速移動的名人和模糊的影片可能會影響 Rekognition Video API 的品質。此外,濃妝及演員/女演員經常使用的偽裝也可能會影響品質。

文字偵測

問:什麼是文字偵測?

文字偵測是 Amazon Rekognition 的一項功能,可讓您偵測和辨識影像或影片中的文字,像是街名、標題、產品名稱、重疊圖形、影片字幕和車輛牌照。文字偵測專門設計用於處理真實世界中的影像和影片,而非針對文件影像所建立。Amazon Rekognition 的 DetectText API 會處理影像,並針對每個偵測到的字元字串傳回文字標籤、週框方塊,以及可信度分數。例如,在影像共享和社群媒體應用程式中,您可以根據包含相同文字標籤的影像索引啟用視覺搜尋。在安全應用程式中,則可透過交通攝影機所拍攝影像中的車牌號碼來識別車輛。同樣地,您可以針對影片使用 StartTextDetection 和 GetTextDetection API 來偵測文字,並取得每次偵測的可信度分數與時間戳記。您可以在媒體和娛樂應用程式中建立文字中繼資料以支援相關內容的搜尋,例如新聞、運動賽事比分、商業廣告及標題。您還可以檢閱偵測到的文字是否違反政策或有違規情形,像是遭濫發垃圾郵件者覆蓋的電子郵件地址或電話號碼。

問:Amazon Rekognition 文字偵測支援哪些文字類型?

文字偵測專門設計用於處理真實世界中的影像和影片,而非針對文件影像所建立。該功能支援各種版面配置、字體和樣式中以各種方向重疊在背景物件 (像是橫幅和海報) 上的大多數內嵌拉丁書寫文字和數字。文字偵測可辨識每個影像或影格高達 50 個字元序列,並以字或行列出。文字偵測可支援從水平軸方向旋轉 -90 到 +90 度的文字。

問:是否可將文字偵測限制在影像或影格的特定區域?

可以。文字偵測的篩選選項能讓您在 API 請求中指定最多 10 個感興趣區域 (ROI)。Amazon Rekognition 只會傳回屬於這些區域的文字。 

問:是否可按文字可信度或週框方塊大小來篩選文字偵測內容?

可以。您能夠在 API 請求中使用文字偵測的篩選選項來指定最低可信度分數或最小週框方塊尺寸的閾值。

問:如何提供回饋給 Rekognition 以改進其文字辨識功能?

請透過 AWS 客戶支援向我們提出您的要求。Amazon Rekognition 會根據客戶回饋持續擴增可辨識的文字內容類型。

PPE 偵測

問:Amazon Rekognition 可以偵測到哪些個人防護設備 (PPE)?

Amazon Rekognition “DetectProtectiveEquipment” 可以偵測常見類型的面罩、手套和頭罩。如需進一步了解,請參閱功能文件。您還可以使用 Amazon Rekognition 自訂標籤來偵測個人防護設備,例如反光背心、安全護目鏡和您企業專有的其他個人防護設備。 如需了解如何使用 Amazon Rekognition 自訂標籤進行自訂 PPE 偵測,請瀏覽此 GitHub 儲存庫

問:Amazon Rekognition 是否可以偵測防護設備位置並傳回週框方塊?

可以。Amazon Rekognition “DetectProtectiveEquipment” API 可以偵測圖像中人物身上的防護設備例如 (面罩、手套和頭罩) 的位置。您可以取得所偵測到每個防護設備的週框矩形座標以及可信度分數。如需 API 回應的更多詳細資訊,請參閱文件

問:此服務是否可以偵測口罩正確佩戴與否?

Amazon Rekognition “DetectProtectiveEquipment” API 輸出為每個偵測到的防護設備提供了 “CoversBodyPart” 值 (真/假) 和布林值的可信度。這提供了有關防護設備是否在人員相應身體部位的資訊。對於相應的身體部位上是否存在防護設備的預測,有助於篩選出個人防護設備在圖像中但實際上不在人身上的情況。但是,這並不表示或暗示該人員已受到該防護設備的充分保護,或該防護設備本身已正確穿戴。

問:Amazon Rekognition PPE 偵測能否識別出偵測到的人?

不能。Amazon Rekognition PPE 偵測不會執行面部識別或面部比較,因此無法識別偵測到的人。

問:我在哪裡可以找到有關 API 限制和延遲的更多資訊?

請參閱 Amazon Rekognition PPE 偵測文件以取得有關 API 限制和延遲的最新詳細資訊。 

問:如何將工作場所攝影機中的圖像傳送到 Amazon Rekognition?

您可以透過多種方式從工作場所的攝影機中採樣圖像。請參閱 Amazon Rekognition PPE 偵測部落格以了解更多資訊。

問:PPE 偵測如何收費?

Amazon Rekognition PPE 偵測的收費與其他 Amazon Rekognition Image API 相似,按每張圖像收費。如需進一步了解,請瀏覽 Amazon Rekogntion 定價頁面。 

Amazon Rekognition Streaming Video Events

問:什麼是 Amazon Rekognition Streaming Video Events?
Amazon Rekognition Streaming Video Events 使用機器學習透過連線攝影機偵測物件,以即時提供可操作的提醒。Amazon Rekognition Streaming Video Events 與您的全新和現有的 Kinesis Video Streams 共同處理影片串流 (每個運動事件最多 120 秒),並在偵測到所需的關注物件時立即通知您。您可以使用這些通知

  • 向您的最終使用者傳送智能提醒,例如「在前門偵測到包裹」。
  • 提供家庭自動化功能,例如「偵測到人時打開車庫燈」。
  • 與 Echo 裝置等智慧助手整合,在偵測到物體時提供 Alexa 通知。
  • 提供智慧搜尋功能,例如搜尋偵測到包裹的所有影片剪輯。

問:Amazon Rekognition Streaming Video Events 如何運作?
您可以使用全新或現有的 Kinesis Video Streams,以開始使用 Amazon Rekognition Streaming Video Events。在為 Amazon Rekognition 進行串流處理器設定時,您可以選擇想要偵測的所需標籤 (人、寵物或包裹)、Rekognition 應為每個事件處理的影片持續時間 (每個動作事件最長 120 秒) 及/或要透過 Rekognition 處理的畫面上的關注區域。僅當您向 Rekognition 傳送通知以開始處理影片串流時,Rekognition Streaming Video Event API 才會處理影片。

在連線的攝影機上偵測到運動時,您會向 Rekognition 傳送通知以開始處理影片串流。Rekognition 會處理相應的 Kinesis Video Stream (運動偵測後),以尋找您指定的所需物件。一旦偵測到所需物件,Amazon Rekognition 即會向您傳送通知。此通知包括偵測到的物件、邊界框、物件的放大影像和時間戳記。

問:Amazon Rekognition Streaming Video Events 支援哪些標籤?
Amazon Rekognition Streaming Video Events 可支援人員、寵物和包裹。

問:Amazon Rekognition Streaming Video API 可偵測哪些寵物和包裹類型?
Amazon Rekognition Streaming Video Event API 支援狗和貓進行寵物偵測。API 可高準確度偵測中型和大型紙板箱。API 還可偵測較小的盒子、氣泡郵件信封和資料夾,但有時可能會錯過其中的一些物件。

問:是否會對偵測到的每個標籤單獨計費? 我可以選擇加入哪些標籤嗎?
否,不會對每個標籤單獨計費。依據 Rekognition 處理的串流影片持續時間計費。在設定串流處理設定時,您可以選擇加入特定標籤 (寵物、包裹),或選擇加入全部三個標籤 (人、寵物、包裹)。

問:是否需要將影片連續串流至 Amazon Rekognition?
否,您不必將影片連續串流至 Amazon Rekognition。

問:是否應建立全新的 Kinesis Video Streams (KVS) 以使用 Streaming Video Events?
Amazon Rekognition Streaming Video Events 適用於全新和現有的 Kinesis Video Streams。只需將相關 KVS 串流與 Amazon Rekognition Streaming Video Events API 整合,即可開始對 KVS 串流進行影片分析。

問:Amazon Rekognition 何時會向我傳送通知?
Amazon Rekognition 開始處理運動偵測後的影片串流。您可以設定處理此影片串流的持續時間 (每個事件最多 120 秒)。一旦 Amazon Rekognition 在影片串流中偵測到關注物件,Rekognition 就會向您傳送通知。此通知包括偵測到的物件類型、邊界框、偵測到的物件放大影像和時間戳記。

問:標籤偵測支援什麼解析度和 fps?
為保持較低的成本和延遲,Amazon Rekognition Streaming Video Events 支援 1080p 或更低解析度的影片串流。Rekognition 以 5 fps 的速度處理影片串流。

問:串流影片支援哪些編解碼器和檔案格式?
Amazon Rekognition Video 支援 MPEG-4 (.mp4) 或 MOV 格式的 H.264 檔案。

問:每個事件處理影片的時長上限是多少?
每個事件最多可以處理 120 秒的影片。

問:是否可以為我的影片串流選擇要處理的畫面特定區域?
是,作為設定 StreamProcessor 的一部分,您可以選擇要在畫面上處理的關注區域。Amazon Rekognition 將僅處理該範圍的特定區域。

問:可以使用 Amazon Rekognition 處理多少並行影片串流?
Amazon Rekognition Streaming Video Events 可支援每個 AWS 客戶 600 個並行工作階段。如果您需要提高此限制,請聯絡您的客戶經理。

Amazon Rekognition 存放影片分析

問:Amazon Rekognition Video 可偵測哪些類型的實體?
Amazon Rekognition Video 可偵測影片中的物件、場景、地標、臉孔、名人、文字和不當內容。您還可以使用自己的儲存庫或臉孔圖像集合來搜尋影片中出現的臉孔。

問:Amazon Rekognition Video 支援哪些類型的檔案格式和編解碼器?
Amazon Rekognition Video 支援 MPEG-4 (.mp4) 或 MOV 格式的 H.264 檔案。如果您的影片檔案使用其他編解碼器,則可以使用 AWS Elemental MediaConvert 轉碼為 H.264。

問:Amazon Rekognition Video 非同步 API 的運作方式為何?
Amazon Rekognition Video 可以處理儲存在 Amazon S3 儲存貯體中的影片。您可以使用一組非同步操作:透過呼叫 Start 操作 (例如 StartLabelDetection) 開始影片分析來偵測物件和場景。請求的完成狀態會發佈到 Amazon Simple Notification Service (SNS) 主題。要從 Amazon SNS 主題取得完成狀態,請使用 Amazon Simple Queue Service (SQS) 佇列或 AWS Lambda 函數。取得完成狀態之後,呼叫 Get 操作 (例如 GetLabelDetection) 以取得請求的結果。如需可用 Amazon Rekognition Video API 清單,請參閱此頁面

問:如何找到影片中每次偵測的時間?
Amazon Rekognition Video 按時間戳記或影片片段傳回標籤結果。使用 GetLabelDetection API 中的 AggregateBy 輸入參數,可選擇您要組織這些結果的方式。 

  • 按時間戳記組織標籤結果時,Amazon Rekognition Video 每次在影片時間表中偵測到標籤時,將傳回每個標籤。例如,如果在 2000ms 和 4000ms 偵測到「狗」,Amazon Rekognition Video 將傳回 2 個「狗」標籤項,一個在 2000ms,另一個在 4000ms。 
  • 按影片片段組織標籤結果時,Amazon Rekognition Video 會傳回在多個連續畫面中偵測到標籤時的影片片段。影片片段由開始時間戳記、結束時間戳記和持續時間定義。例如,如果在 2000ms 和 4000ms 的 2 個連續畫面中偵測到「狗」,Amazon Rekognition Video 將傳回 1 個「狗」標籤項,開始時間戳記為 2000ms,結束時間戳記為 4000ms,持續時間為 2000ms。 

若要進一步了解時間戳記和片段並查看 API 回應範例,請造訪在影片中偵測標籤

問:Amazon Rekognition Video 可以執行多少個並行影片分析任務?
您可以使用 Amazon Rekognition Video 處理多達 20 個並行任務。如需限制的詳細資訊,請參閱我們的限制頁面

問:我應該使用何種影片解析度?
Amazon Rekognition Video 自動處理各種影片解析度和影片品質。我們建議使用 720p (1280×720 像素) 至 1080p (1920x1080 像素) 或其他長寬比的等效解析度,以獲得最佳效果。解析度非常低 (例如 QVGA 或 240p) 和品質很差的影片可能會對結果品質產生負面影響。

問:什麼是人物路徑?
使用 Rekognition Video,您可以找到每個人在影片時間軸上的路徑。即使攝影機在移動中,Rekognition Video 也能偵測出人物,並針對每個偵測到的人傳回週框方塊和臉孔,內含臉部屬性與時間戳記。針對零售應用程式,這可產生匿名的客戶洞見,例如客戶在購物中心走道的移動路徑,或是客戶在結帳隊伍中等待多久時間。

使用 Amazon Rekognition Video 進行媒體分析

問:Amazon Rekognition Video 可以偵測哪些類型的媒體分析片段?

Amazon Rekognition Video 可以偵測下列類型的媒體分析的片段或實體:

  • 黑色畫面:影片通常包含一小段無音訊的黑色空白畫面,用作插入廣告或劃定場景或開場演職員表等節目段結尾的提示。借助 Amazon Rekognition Video,您可以偵測此類黑色畫面序列,以自動執行廣告插入、為 VOD 打包內容並劃分各種節目段或場景。帶有音訊的黑色畫面 (例如淡出或旁白) 被視為內容且不返回。
  • 演職員表:Amazon Rekognition Video 可協助您自動識別電影或電視節目開頭和結尾演職員表開始和結束的確切畫面。使用此資訊,您可以在 VOD 應用程式中產生「瘋狂標記」或互動式觀衆提示,如「下一集」或「跳過簡介」。Amazon Rekognition Video 受過訓練,可以處理多種類型的開頭和結尾演職員表風格,從簡單的捲動演職員表,到隨內容出現的更具挑戰性演職員表、場景中的演職員表或動漫內容中的風格化演職員表。
  • 鏡頭:鏡頭是由一台攝影機連續拍攝的一系列相互關聯的連續圖像,代表在時間和空間上的連續動作。借助 Amazon Rekognition Video,您可以偵測每個鏡頭的開始、結束和持續時間,並可以計算內容中的所有鏡頭。鏡頭中繼資料可用於以下應用程式,例如使用選定的鏡頭建立宣傳影片、產生一組避免鏡頭之間過渡內容的預覽縮圖,以及將廣告插入不會干擾觀看者體驗的位置,例如鏡頭中有人在說話的畫面。
  • 彩條信號:Amazon Rekognition Video 讓您可以偵測顯示 SMPTE 彩條信號的影片部分,SMPTE 或 EBU 顏色條是以特定模式顯示的一組顏色,用於確保顏色在廣播監控器、節目和攝影機上正確校正。如需 SMPTE 彩條信號的詳細資訊,請參閱 SMPTE 彩條信號。當彩條信號作為預設信號而不是內容連續顯示時,此中繼資料可用於透過從內容中移除彩條信號來為 VOD 應用程式準備內容,或用於偵測錄製影片中廣播信號遺失等問題。
  • 場記板:場記板由多個部分組成,通常位於影片的開頭,包含有關插曲、工作室、影片格式、音訊通道等的文字中繼資料。Amazon Rekognition 可以識別此類場記板的開頭和結尾,輕鬆讓操作員在準備內容進行最終檢視時使用文字中繼資料或簡單地移除場記板。
  • 工作室標誌:工作室標誌是顯示製作節目的製作工作室的標誌或徽標的序列。Amazon Rekognition 可以識別此類序列,輕鬆讓操作員對其進行檢閱以識別工作室。
  • 內容:內容是指電視節目或電影中包含節目或相關元素的部分。黑色畫面、演職員表、彩條信號、場記板和工作室標誌不會視為內容。Amazon Rekognition Video 可讓您偵測影片中每個內容片段的開頭和結尾,從而實現多種用途,例如尋找節目播放時間或尋找用於特定用途的特定片段。例如,在影片開頭快速回顧上一集是一種內容類型。同樣地,演職員表播完後,可以顯示演職員表後的彩蛋內容。而且,一些影片的結尾可能具有「無文字」內容,這些內容是一組包含重疊文字的所有節目內容,但移除該文字可實現另一種語言的國際化。在 Amazon Rekognition Video 偵測到所有內容片段後,您可以套用特定的領域知識 (如「我的影片一律以回顧開頭」),對每個片段進行進一步分類,或予以傳送進行人工審查。

Amazon Rekognition Video 為每個偵測到的實體提供開頭、結尾、持續時間和時間碼,並為每個實體提供時間戳記 (毫秒)、SMPTE 格式代碼和畫面號選項。

問:如何開始使用 Amazon Rekognition Video 進行媒體分析?

可透過 Amazon Rekognition Video 片段偵測 API 使用媒體分析功能。這是一個非同步 API,由兩個操作組成:用於開始分析的 StartSegmentDetection,以及用於獲得分析結果的 GetSegmentDetection。若要開始使用,請參閱文件

如果您想視覺化媒體分析的結果,甚至想嘗試將其他 Amazon AI 服務 (如 Amazon Transcribe) 用於自己的影片,請使用 Media Insights 應用程式。這是一種無伺服器架構和示範應用程式,利用了 AWS Machine Learning 和 Media 服務,讓您可以輕鬆地從您的影片、音訊、文字和圖像資源中產生洞見和開發應用程式。您可以使用提供的 AWS CloudFormation 範本輕鬆啟動自己的示範應用程式,以試用自己的影片並視覺化分析結果。

問:什麼是畫面精確時間碼?

畫面精確時間碼可為影片或實體的相關片段提供精確的畫面號。媒體公司通常使用 SMPTE (電影電視工程師協會) 格式 (小時:分鐘:秒:畫面) 來處理時間碼,例如:00:24:53:22。

問:Amazon Rekognition Video 片段偵測畫面是否精確?

是的,Amazon Rekognition Video 片段偵測 API 提供畫面精確的 SMPTE 時間碼,以及每次偵測開始和結束的毫秒時間戳記。

問:Amazon Rekognition Video 段偵測可以處理哪些類型的畫面播放速率格式?

Amazon Rekognition Video 片段偵測可自動處理畫面播放速率介於 15 至 60fps 之間片段的整數、小數和丟失畫面標準。片段偵測支援常見的幀速率,例如 23.976 fps、25fps、29.97 fps 和 30fps。在每種情況下,都使用畫面播放速率資訊來提供幀精確的時間碼。

問:我可以套用哪些篩選選項?

您可以在發出 API 請求時為每個片段類型指定最低可信度。例如,您可以篩選掉低於 70% 可信度分數的任何片段。對於黑色畫面偵測,您還可以控制您認為是黑色像素的最大像素亮度,例如,對於 0 至 255 的顏色範圍,值為 40。此外,您還可以控制畫面中需要滿足此黑色像素亮度標準的像素百分比,以使畫面分類為黑色畫面,例如,99%。這些篩選條件可讓您在偵測黑色畫面時考慮各種影片品質和格式。例如,從磁帶存檔中回收的影片可能具有雜訊,並且與現代數位影片相比具有不同的黑色級別。如需詳細資訊,請參閱此頁面

計費

問:Amazon Rekognition 如何計算所處理的影像數量?

針對接受影像輸入的 API,Amazon Rekognition 會將所分析的影像實際數量視為處理的影像數量。DetectLabels、DetectModerationLabels、DetectFaces、IndexFaces、RecognizeCelebrities 和 SearchFaceByImage 和 Image Properties 都屬於這個類別。CompareFaces API 會有兩個影像輸入,其中只有原始影像會計算為一個單位的受處理影像。

呼叫 API 時若不需要影像做為輸入參數,則 Amazon Rekognition 會把每一個 API 呼叫計算為一個受處理影像。SearchFaces 屬於此類別。

其餘的 Amazon Rekognition API,包括 ListFaces、DeleteFaces、CreateCollection、DeleteCollection、ListCollections,都不會納入受處理影像的計算。

問:Amazon Rekognition 如何計算處理的影片分鐘數?

針對影片存檔,Amazon Rekognition 會計算 API 成功處理的影片分鐘數並據此計費。針對即時串流影片,會以每五秒鐘做為一個區塊來計算成功處理的影片費用。

問:哪些 Amazon Rekognition API 需付費使用?

需付費使用的 Amazon Rekognition Image API 包括:DetectLabels、DetectModerationLabels、DetectText、DetectFaces、IndexFaces、RecognizeCelebrities、SearchFaceByImage、CompareFaces、SearchFaces 和 Image Properties。Amazon Rekognition Video 則是按照 StartLabelDetection、StartFaceDetection、StartFaceDetection、StartTextDetection、StartContentModeration、StartPersonTracking、StartCelebrityRecognition、StartFaceSearch 和 StartStreamProcessor API 成功處理的影片分鐘數來計費。

問:Amazon Rekognition 的定價多少?

請參閱 Amazon Rekognition 定價頁面,了解目前的定價資訊。

問:在自己的人臉集合中存放特徵向量是否需要付費?

是。Amazon Rekognition 每個月針對每 1,000 個人臉向量收取 0.01 USD。詳細資訊請參閱定價頁面

問:Amazon Rekognition 是否也包含在 AWS 免費方案中?

是。Amazon Rekognition 也是 AWS 免費用量方案的一部分,您可以免費開始使用。註冊完成後,Amazon Rekognition 新客戶前 12 個月每月可免費分析最多 5,000 個影像。在這個免費方案之下,您可以使用所有 Amazon Rekognition API (Image Properties 除外),也可以免費儲存高達 1,000 張臉孔。此外,Amazon Rekognition Video 客戶在第一年的每個月可以免費分析 1,000 分鐘的影片。

問:價格含稅嗎?

如需有關稅額的詳細資訊,請參閱 Amazon Web Services 稅額說明

AWS 整合

問:Amazon Rekognition Video 是否可處理存放在 Amazon S3 的影像?

是。您只要將 Amazon Rekognition API 指向您的 S3 儲存貯體,便可以開始分析儲存在 Amazon S3 的影像。您不須移動資料。關於 S3 物件與 Amazon Rekognition API 呼叫的搭配使用方法,詳細資訊請參閱偵測標籤的運用

問:使用 Amazon Rekognition 時,是否可搭配使用存放在另一個區域中 Amazon S3 儲存貯體內的影像?

不,請確認您要使用的 Amazon S3 儲存貯體與 Amazon Rekognition API 端點位於相同的區域中。

問:使用 Amazon Rekognition 時要如何批次處理多個影像檔?

您可以一次處理大量 Amazon S3 影像,請依照 GitHub 的 Amazon Rekognition 批次處理範例所述步驟操作。

問:AWS Lambda 和 Amazon Rekognition 要如何搭配使用?

Amazon Rekognition 可無縫存取 AWS Lambda,讓您的 Amazon S3 和 Amazon DynamoDB 等 AWS 資料存放區享有觸發式影像分析功能。若要將 Amazon Rekognition 和 AWS Lambda 搭配使用,請依照這裡說明的步驟操作,選擇一個 Amazon Rekognition 藍圖。

問:Amazon Rekognition 是否可與 AWS CloudTrail 搭配使用?

是。Amazon Rekognition 支援將以下動作記錄為 CloudTrail 日誌檔中的事件:CreateCollection、DeleteCollection、CreateStreamProcessor、DeleteStreamProcessor、DescribeStreamProcessor、ListStreamProcessors 和 ListCollections。如需與 AWS CloudTrail 整合的 Amazon Rekognition API 呼叫詳細資訊,請參閱 Logging Amazon Rekonition API Calls with AWS CloudTrail。

資料隱私權

問:是否會存放 Amazon Rekognition 處理的影像和影片輸入?AWS 如何使用這些輸入內容?

Amazon Rekognition 可能會存放及使用服務所處理的影像和影片輸入,這些輸入僅用於提供及維護服務 (除非您如下所示選擇退出),以及開發 Amazon Rekognition 和其他 Amazon 機器學習/人工智慧技術並改善品質。使用您的內容對於持續改善您的 Amazon Rekognition 客戶體驗 (包括開發及訓練相關技術) 非常重要。不過,我們不會使用內容中的任何個人識別資訊,為產品和服務尋找目標客群,或向您或您的最終使用者行銷產品或服務。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/。您可以使用 AWS Organizations 退出政策,選擇不提供您的影像和影片輸入讓我們用於改善或開發 Amazon Rekognition 和其他 Amazon 機器學習/人工智慧技術的品質。如需如何退出的資訊,請參閱管理 AI 服務退出政策

問:是否可以刪除 Amazon Rekognition 存放的影像和影片輸入?

是。您可以聯絡 AWS Support,請求刪除與您帳戶關聯的影像和影片輸入。刪除影像和影片輸入可能會降低 Amazon Rekognition 的使用體驗。

問:誰可以存取 Amazon Rekognition 所處理及存放的內容?

只有得到授權的員工可以存取 Amazon Rekognition 所處理的內容。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/

問:我的內容經過 Amazon Rekognition 處理及儲存後,我仍然具備這些內容的擁有權嗎?

您會永久保有自己內容的擁有權,而且我們只會在取得同意的情況下,才使用您的內容。

問:Amazon Rekognition 所處理的內容會移出我使用 Amazon Rekognition 的 AWS 區域嗎?

Amazon Rekognition 處理的任何內容都會以靜態方式加密並存放在您使用 Amazon Rekognition 的 AWS 區域。除非您如下所示選擇退出,否則 Amazon Rekognition 處理的部分內容可能會存放在其他 AWS 區域,僅用於繼續改善及開發 Amazon Rekognition 客戶使用體驗和其他 Amazon 機器學/人工智慧技術。您可以聯絡 AWS Support,請求刪除與您帳戶關聯的影像和影片輸入。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/。如果您退出不讓我們使用您的內容來開發 Amazon Rekognition 和其他 Amazon 機器學習/人工智慧技術並改善品質,您的內容將不會存放在另一個 AWS 區域中。如需如何退出的資訊,請參閱管理 AI 服務退出政策

問:我是否可以在針對 13 歲以下兒童且受兒童線上隱私保護法令 (COPPA) 規範的網站、程式或其他應用程式上使用 Amazon Rekognition?

是,您必須遵守 Amazon Rekognition 服務條款的規範,包括您有義務依據 COPPA 提供任何必要的通知和取得任何必要的可查證家長同意,如此即可在針對 13 歲以下兒童的全部或部分網站、程式或其他應用程式使用 Amazon Rekognition。

問:如何判斷我的網站、程式或應用程式是否受 COPPA 規範?

如需 COPPA 要求的資訊以及判斷您的網站、程式或其他應用程式是否受 COPPA 規範的指導,請直接參閱美國聯邦貿易委員會提供和維護的資源。 這個網站也包含如何判斷某個服務 (全部或部署) 是否針對 13 歲以下兒童的相關資訊。

問:Amazon Rekognition 是否為 HIPAA 合格服務?

Amazon Rekognition 是 AWS 商業夥伴增補合約 (AWS BAA) 下涵蓋的 HIPAA 合格服務。如果您擁有 AWS BAA,Amazon Rekognition 只會在您 AWS BAA 條款允許的範圍內使用、公開和維護受保護醫療資訊 (PHI)。

存取控制

問:我要如何控管使用者存取 Amazon Rekognition?

Amazon Rekognition 已和 AWS Identity and Access Management (IAM) 整合。 AWS IAM 政策能確保唯有授權使用者可以存取 Amazon Rekognition API。如需詳細資訊,請參閱 Amazon Rekognition 身份驗證與存取控制頁面

檢舉不當使用

問:我要如何檢舉可能不當使用 Amazon Rekognition 的行為?

如果您懷疑有人以濫用或違法的方式使用 Amazon Rekognition,以至於侵犯您或其他使用者的權利,請舉報此使用行為,AWS 將會調查此問題

負責任 AI

問:AWS 是否有任何關於 Rekognition 負責任 AI 資料?

是,我們針對 AWS 一般服務並特別針對 Rekognition 負責任 AI 資料。若是 AWS 一般服務,我們提供負責任 AI 指引和 AWS 負責任 AI 政策,這會為客戶提供各種資源和工具,以協助他們負責任地建置和使用 AI 系統。此外,我們還針對某些 Amazon Rekognition 功能提供 AWS AI 服務卡。AI 服務卡說明 Rekognition 的預期使用案例、Rekognition 如何使用機器學習,以及負責任設計和使用 Rekognition 的關鍵考量。

生物特徵辨認相關法律

問:我應了解哪些生物特徵辨認相關法律?

生物特徵辨認相關法律是一種隱私權法,適用於收集、處理或使用生物特徵資料 (例如掃描手或面部幾何圖形)。如果您的服務涉及收集、處理或使用生物特徵資料,這些法律可能適用。許多生物特徵辨認相關法律對於向您的最終使用者提供聲明和取得同意,以及遵守刪除請求都有特定要求。若適用於您的服務,您應了解這些要求,這是共同責任模式的一部分。如果您提供聲明並取得同意,您應代表任何相關服務供應商執行,包括 AWS (做為您的服務供應商身分)。此外,您還可以使用 DeleteFacesDeleteCollection 操作來刪除向量。請參閱下列服務供應商的聲明範例和同意語言,並請參閱服務條款,了解使用 Rekognition 的相關要求。

問:AWS 是否有任何範例語言來代表服務供應商提供聲明和同意?

是,以下是代表服務供應商 (例如 AWS) 提供聲明和同意的語言範例。您有責任自行評估您對 Rekognition 的使用是否符合適用的法律要求,並且此範例語言並非法律建議。

[您的公司名稱 (「公司」)] 使用服務提供商進行 [描述用途,例如「身分驗證服務」]。此服務供應商可代表 [公司] 收集、存放和使用生物特徵辨認識別碼和生物特徵辨認資訊 (「生物特徵辨認資料」),特別是 [描述相關資料的類型] 以提供服務。收集或取得該等資料的初始用途得到滿足、您請求刪除資料時,或法律要求的更早時間,[公司] 將指示其服務供應商永久銷毀代表 [公司] 存放的生物特徵辨認資料。生物特徵辨認資料可能會根據需要,在 [公司] 及其服務供應商之間傳輸,以提供和接收此服務。您特此同意 [公司] 及其服務供應商依照上述要求,收集、使用和存放您的生物特徵辨認資料。

進一步了解 Amazon Rekognition 定價

瀏覽定價頁面
準備好開始建立?
開始使用 AWS Rekognition
還有其他問題嗎?
聯絡我們