AWS 宣布全面推出 Amazon Textract
西雅圖--今天,Amazon.com 公司(納斯達(dá)克股票代碼:AMZN)旗下的 Amazon Web Services, Inc. (AWS) 宣布全面推出 Amazon Textract,這是一項使用機(jī)器學(xué)習(xí)自動提取文本的完全托管服務(wù)和數(shù)據(jù),包括來自表格和表格的數(shù)據(jù),幾乎可以在任何文檔中使用,無需人工審核、自定義代碼或機(jī)器學(xué)習(xí)經(jīng)驗。 Amazon Textract 不僅可以識別簡單的光學(xué)字符識別 (OCR),還可以識別表單中字段的內(nèi)容、存儲在表格中的信息以及顯示信息的上下文,例如稅表或產(chǎn)品中的姓名或社會保險號庫存報告中倉庫中的 SKU 或數(shù)量。提取的文本和數(shù)據(jù)可以很容易地用于對大型文檔檔案進(jìn)行智能搜索,或者可以加載到數(shù)據(jù)庫中供應(yīng)用程序使用,例如會計、審計和合規(guī)軟件。 Amazon Textract 的 API 支持多種圖像格式,如掃描、PDF 和照片,客戶可以將其與 Amazon Elasticsearch Service、Amazon DynamoDB 和 Amazon Athena 等數(shù)據(jù)庫和分析服務(wù)以及 Amazon Comprehend、Amazon Comprehend Medical、Amazon 等其他機(jī)器學(xué)習(xí)服務(wù)一起使用Translate 和 Amazon SageMaker 從提取的文本和數(shù)據(jù)中獲取更深層次的含義。要開始使用 Amazon Textract,請訪問 。
“我們已經(jīng)使用 Amazon Textract 代表金融機(jī)構(gòu)分析了數(shù)以萬計的貸款文件,并且我們自己的軟件即服務(wù)產(chǎn)品通過該服務(wù)得到了增強(qiáng),使我們能夠識別 95% 的貸款缺陷應(yīng)用程序包并幫助銀行減少手動數(shù)據(jù)輸入”
許多公司通過手動數(shù)據(jù)輸入或簡單的 OCR 軟件從合同、費(fèi)用報告、抵押擔(dān)保、基金招股說明書、稅務(wù)文件、醫(yī)院索賠和患者表格等文件中提取文本和數(shù)據(jù)。這是一個耗時且通常不準(zhǔn)確的過程,它產(chǎn)生的輸出需要大量的后處理,然后才能以其他應(yīng)用程序可用的格式放置。這是因為現(xiàn)有的 OCR 技術(shù)無法識別表單和表格等常見布局,只能生成冗長且通常不準(zhǔn)確的文本轉(zhuǎn)儲。相反,組織想要的是能夠從任何格式的文檔以及各種文件類型和模板中的表單和表格中準(zhǔn)確識別和提取文本和數(shù)據(jù)。 Amazon Textract 幾乎可以分析任何類型的文檔,自動生成高度準(zhǔn)確的文本、表單和表格數(shù)據(jù)。 Amazon Textract 識別文檔中表格和表格中的文本和數(shù)據(jù)(例如拍攝收據(jù)中的行項目和總計、W2 中的稅務(wù)信息或掃描庫存報告中表格中的值)并識別一系列文檔格式,包括那些特定于金融服務(wù)、保險和醫(yī)療保健的產(chǎn)品,無需任何定制或人工干預(yù)。 Amazon Textract 讓客戶可以在短短幾個小時內(nèi)輕松準(zhǔn)確地處理數(shù)百萬個文檔頁面,顯著降低文檔處理成本,讓客戶專注于從文本和數(shù)據(jù)中獲取商業(yè)價值,而不是在后期處理上浪費(fèi)時間和精力.結(jié)果通過 API 交付,無需任何機(jī)器學(xué)習(xí)經(jīng)驗即可輕松訪問和使用。
“Amazon Textract 的強(qiáng)大之處在于它可以準(zhǔn)確地從幾乎任何文檔中提取文本和結(jié)構(gòu)化數(shù)據(jù),而無需機(jī)器學(xué)習(xí)經(jīng)驗。隨后,開發(fā)人員可以使用我們的數(shù)據(jù)庫和分析服務(wù)(如 Amazon Elasticsearch Service、Amazon DynamoDB 和 Amazon Athena)分析和查詢提取的文本和數(shù)據(jù),并與 Amazon Comprehend、Amazon Comprehend Medical、Amazon Translate 和 Amazon SageMaker 等其他機(jī)器學(xué)習(xí)服務(wù)集成幫助客戶從提取的文本和數(shù)據(jù)中獲得更深層次的意義,”亞馬遜機(jī)器學(xué)習(xí)副總裁 Swami Sivasubramanian 說。 “除了與其他 AWS 服務(wù)的集成之外,圍繞 Amazon Textract 開發(fā)的豐富合作伙伴社區(qū)使客戶能夠從他們的文件集合中獲得真正的意義、更高效地運(yùn)營、提高安全合規(guī)性、自動化數(shù)據(jù)輸入并促進(jìn)更快的業(yè)務(wù)決策?!?/p>
Amazon Textract 獲取存儲在 Amazon S3 存儲桶中的掃描文件,讀取它們,并以帶有頁碼、部分、表單標(biāo)簽和數(shù)據(jù)類型注釋的 JSON 文本的形式返回數(shù)據(jù)。然后,這些數(shù)據(jù)可用于一系列應(yīng)用(例如生成智能搜索索引、編輯大量表單中的文本、創(chuàng)建自動貸款審批工作流程、使用數(shù)據(jù)進(jìn)行監(jiān)管合規(guī)以及標(biāo)記保險索賠的欺詐風(fēng)險)??蛻艨梢詫?shù)據(jù)加載到電子表格、數(shù)據(jù)庫和工資系統(tǒng)等業(yè)務(wù)軟件中,也可以使用 Amazon ElasticSearch、Amazon DynamoDB、Amazon Redshift 或 Amazon Athena 分析和查詢數(shù)據(jù)。 Amazon Textract 現(xiàn)已在美國東部(俄亥俄)、美國東部(弗吉尼亞北部)、美國西部(俄勒岡)、歐洲(愛爾蘭)推出,明年將擴(kuò)展到其他區(qū)域。
The Globe and Mail 是加拿大的標(biāo)志性媒體和加拿大最知名的媒體品牌。 “作為一家新聞媒體公司,我們依賴于許多 PDF 或掃描源文檔,例如 FOI(信息請求自由),這些文檔在我們以前無法訪問的表格中包含重要信息,”總經(jīng)理 Michael O'Neill 說The Globe and Mail 的數(shù)字和數(shù)據(jù)科學(xué)部主任?!斑@些文件未被充分利用,因為記者無法輕松訪問它們或不知道它們的存在。使用 Amazon Textract,我們能夠從 PDF 中的表格中提取信息并將這些數(shù)據(jù)輕松輸出到 CSV,并通過讓我們的記者可以搜索查詢來輕松訪問這些文檔。這將我們的記者獲取信息的效率提高了十倍?!?/p>
Met Office 是英國的國家氣象服務(wù)機(jī)構(gòu),在提供天氣和氣候服務(wù)方面處于世界領(lǐng)先地位。 “我們希望使用 AmazonTextract 將來自文檔檔案的數(shù)百萬歷史天氣觀測數(shù)據(jù)數(shù)字化,”氣象局氣候科學(xué)家 Philip Brohan 說?!皩⑦@些觀測數(shù)據(jù)提供給科學(xué)界將提高我們對氣候變率和變化的理解?!?/p>
普華永道通過提供質(zhì)量保證、稅務(wù)和咨詢服務(wù)來幫助組織和個人創(chuàng)造價值。 “在普華永道,我們致力于為客戶提供智能自動化工具,幫助改變以前的手動流程。我們已將 Amazon Textract 集成到我們的制藥行業(yè)解決方案中,以自動處理各種 FDA 表格(如 MedWatch 和 CIOMS)的文檔,”普華永道的 Siddhartha Bhattacharya 說。 “以前,人們會手動審查、編輯和處理這些表格,每一個都需要幾個小時。事實(shí)證明,Amazon Textract 是可用于這些表單的最高效、最準(zhǔn)確的 OCR 解決方案,它提取所有相關(guān)信息以供審查和處理,并將花費(fèi)的時間從幾小時縮短到幾分鐘?!?/p>
Healthfirst 是一家非營利性管理式醫(yī)療組織,也是紐約發(fā)展最快的健康計劃之一,擁有超過 140 萬多元化成員以及由 35,000 多名提供者和 4,500 名員工組成的網(wǎng)絡(luò)。 “在 Healthfirst,我們正在構(gòu)建數(shù)據(jù)管道,將掃描的醫(yī)療圖表轉(zhuǎn)化為有用的臨床信息,以改善護(hù)理協(xié)調(diào),推動質(zhì)量結(jié)果,并確保為我們覆蓋的成員提供適當(dāng)?shù)膱箐N,”Healthfirst 首席分析官 Steve Prewitt 說。 “我們使用 Amazon Textract 和 Amazon Comprehend Medical 以有效的方式從非結(jié)構(gòu)化數(shù)據(jù)源中收集真正的價值,與我們通常的下游業(yè)務(wù)相比,節(jié)省了 10-20 倍的收入。通過擴(kuò)大分析超過 50,000 個圖表,我們可以找到未記錄的診斷,并為大約 5,000 名成員推薦他們需要的護(hù)理管理?!?/p>
Informed, Inc. 自動化金融機(jī)構(gòu)發(fā)放貸款和開設(shè)銀行賬戶的方式。 “我們已經(jīng)使用 Amazon Textract 代表金融機(jī)構(gòu)分析了數(shù)以萬計的貸款文件,并且我們自己的軟件即服務(wù)產(chǎn)品通過該服務(wù)得到了增強(qiáng),使我們能夠識別 95% 的貸款缺陷Informed Inc. 創(chuàng)始人兼首席執(zhí)行官 Justin Wickett 說、納稅申報表和其他財務(wù)文件。我們計劃擴(kuò)展使用 Amazon Textract 分析的文件類型,以使金融機(jī)構(gòu)能夠利用我們的機(jī)器學(xué)習(xí)模型,為當(dāng)今緩慢和手動的情況帶來實(shí)時決策效率過程?!?/p>
Candor 的使命是改變對抵押貸款行業(yè)造成負(fù)擔(dān)的陳舊、耗時的流程。 “我們使用 OCR 從各種貸方要求的文件中提取數(shù)據(jù),以驗證收入、資產(chǎn)、財產(chǎn)價值等。到目前為止,最好的 OCR 解決方案以 38.4 秒的速度讀取一頁,但 Amazon Textract 只用了一小部分時間就實(shí)現(xiàn)了這一目標(biāo),”Candor 創(chuàng)始人兼首席執(zhí)行官 Tom Showalter 說。 “我們已經(jīng)能夠使用 Textract 準(zhǔn)確讀取復(fù)雜、多樣化的文件,例如銀行對賬單、工資單和稅務(wù)文件,而無需額外的培訓(xùn)或機(jī)器學(xué)習(xí)專業(yè)知識,使我們的客戶能夠在幾天內(nèi)承銷和關(guān)閉貸款,而不是周?!?/p>UiPath 是領(lǐng)先的機(jī)器人流程自動化供應(yīng)商,提供完整的軟件平臺來幫助組織有效地自動化業(yè)務(wù)流程。 “Amazon Textract 將通過增強(qiáng) UiPath 的文檔理解能力進(jìn)一步區(qū)分 UiPath 的機(jī)器人流程自動化平臺,使我們的客戶能夠從文檔中解鎖關(guān)鍵業(yè)務(wù)數(shù)據(jù),將這些數(shù)據(jù)轉(zhuǎn)化為可操作的業(yè)務(wù)洞察力,并將這些洞察力傳遞給業(yè)務(wù)線和運(yùn)營系統(tǒng)”UiPath 首席產(chǎn)品官 Param Kahlon 說。
TeraDact 允許客戶將存儲的圖像和紙質(zhì)文檔大規(guī)模轉(zhuǎn)換為符合隱私的、可用的數(shù)字格式。 “Amazon Textract 的智能文檔平臺為 TeraDact 的專利編輯服務(wù)提供數(shù)據(jù),以自動刪除和保護(hù)敏感數(shù)據(jù)。 TeraDact 客戶可以永久刪除這些數(shù)據(jù),使其永遠(yuǎn)無法恢復(fù),或者選擇用具有適當(dāng)權(quán)限的個人可以恢復(fù)的專利令牌替換敏感數(shù)據(jù)。 TeraDact 首席運(yùn)營官 Tom Trobridge 說:“這對于遵守政府對個人數(shù)據(jù)隱私的要求(例如 GDPR)特別有用?!?/p>
Ripcord 的使命是使用視覺引導(dǎo)機(jī)器人、機(jī)器學(xué)習(xí)和先進(jìn)的人工智能從紙質(zhì)文檔中數(shù)字化和提取知識。這些知識使業(yè)務(wù)流程和工作流程自動化。 “我們利用 Amazon Textract 增強(qiáng)了我們先進(jìn)的實(shí)體提取功能,使許多行業(yè)受益,并獲得了 40 億美元的新薪酬,取得了巨大的成功。我們期待將 Amazon Textract 的使用范圍擴(kuò)大到金融和政府服務(wù)、醫(yī)療保健和法律領(lǐng)域,”Ripcord 首席執(zhí)行官 Alex Fielding 說。
Blue Prism 開發(fā)機(jī)器人流程自動化軟件,為企業(yè)和組織提供更靈活的虛擬勞動力。 “Blue Prism 的聯(lián)網(wǎng) RPA 可以自動化和執(zhí)行關(guān)鍵任務(wù)流程,讓客戶可以自由地專注于更具創(chuàng)造性、更有意義的工作。通過使用 Amazon Textract,我們?yōu)槲覀兊臄?shù)字員工提供了另一個強(qiáng)大的自動化工具。 Amazon Textract 使用機(jī)器學(xué)習(xí)準(zhǔn)確分析來自各種文檔類型的數(shù)據(jù),從而增強(qiáng)了我們客戶的數(shù)字化轉(zhuǎn)型之旅。使用 Amazon Comprehend 和 Amazon Rekognition 等其他 AWS AI 服務(wù),我們可以應(yīng)對從增加安全客戶身份驗證流程到欺詐檢測功能的挑戰(zhàn)。 Amazon Textract 表單數(shù)據(jù)提取的智能性和靈活性可以將 OCR 提升到金融服務(wù)、零售、制造和運(yùn)輸?shù)刃袠I(yè)的新水平,”Blue Prism 首席技術(shù)官兼聯(lián)合創(chuàng)始人 Dave Moss 說。
關(guān)于亞馬遜網(wǎng)絡(luò)服務(wù)
13 年來,Amazon Web Services 一直是世界上最全面、應(yīng)用最廣泛的云平臺。 AWS 為計算、存儲、數(shù)據(jù)庫、網(wǎng)絡(luò)、分析、機(jī)器人、機(jī)器學(xué)習(xí)和人工智能 (AI)、物聯(lián)網(wǎng) (IoT)、移動、安全、混合、虛擬和增強(qiáng)現(xiàn)實(shí)(VR 和 AR)提供超過 165 項功能齊全的服務(wù))、媒體和應(yīng)用程序開發(fā)、部署和管理,來自 21 個地理區(qū)域內(nèi)的 66 個可用區(qū) (AZ),跨越美國、澳大利亞、巴西、加拿大、中國、法國、德國、香港特別行政區(qū)、印度、愛爾蘭、日本、韓國、新加坡、瑞典和英國。數(shù)以百萬計的客戶,包括發(fā)展最快的初創(chuàng)公司、最大的企業(yè)和領(lǐng)先的政府機(jī)構(gòu),都信任 AWS 來支持他們的基礎(chǔ)設(shè)施、變得更加敏捷并降低成本。
關(guān)于亞馬遜
亞馬遜遵循四項原則:以客戶為中心而非以競爭對手為中心、對發(fā)明的熱情、對卓越運(yùn)營的承諾以及長期思考。客戶評論、一鍵購物、個性化推薦、Prime、亞馬遜物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板電腦、Fire TV、亞馬遜 Echo 和 Alexa 是亞馬遜率先推出的一些產(chǎn)品和服務(wù)。
點(diǎn)擊咨詢現(xiàn)在有哪些新興平臺值得關(guān)注 >>>
特別聲明:以上文章內(nèi)容僅代表作者本人觀點(diǎn),不代表ESG跨境電商觀點(diǎn)或立場。如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與ESG跨境電商聯(lián)系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯(lián)系在線顧問
小程序
ESG跨境小程序
手機(jī)入駐更便捷
返回頂部