萬眾矚目,9月17日至19日,由國家發(fā)展和改革委員會、科技部、工業(yè)和信息化部、國家網(wǎng)信辦、中國科學(xué)院、中國工程院和上海市人民政府共同主辦2018世界人工智能大會在上海舉辦。

合合信息亮相2018世界人工智能大會:科技賦能深化業(yè)務(wù)場景

本屆大會以“人工智能賦能新時代”為主題,谷歌、亞馬遜、微軟、騰訊、百度等互聯(lián)網(wǎng)巨頭紛紛現(xiàn)身,共同承辦了總計30余個圍繞人工智能領(lǐng)域開展的分論壇,全球超過200余家人工智能領(lǐng)域領(lǐng)軍企業(yè)參加了論壇和展示活動。

9月18日下午,在由小i機器人承辦的“聽見聽懂AI知你心”智能語音語義分論壇上,合合信息聯(lián)合創(chuàng)始人、副總裁龍騰博士,以“文本智能處理技術(shù)在實踐中的應(yīng)用”為題發(fā)表主題演講。從文本智能處理技術(shù)發(fā)展現(xiàn)狀入手,分析了目前可行的實踐應(yīng)用模式以及未來對于如何讓機器“閱讀”人類文字的美好展望。

要想讓讓機器學(xué)會閱讀,首先要解決入口問題——進行文本識別。OCR技術(shù)作為文本識別技術(shù)的核心,同時也是較為成熟的一種技術(shù)在近幾年得到了人工智能領(lǐng)域的重視。百度、阿里、騰訊等巨頭的紛紛加入也讓沉寂多時的文本處理技術(shù)一時間炙手可熱。在實踐中,當(dāng)OCR技術(shù)面對復(fù)雜的現(xiàn)實情況,譬如抖動模糊、歪斜、反光、形變、遠距離低像素等,文本識別率往往不如人意。

文檔智能處理技術(shù)基于人工智能技術(shù)的發(fā)展,將深度學(xué)習(xí)和文本識別進行結(jié)合,推出的STR(Scenetext Recognition場景文本識別)技術(shù)則很好地解決了傳統(tǒng)OCR技術(shù)無法解決的問題。通過在具體垂直案例中的測試,STR技術(shù)相較OCR技術(shù)的文本識別率得到了質(zhì)的飛躍。以銀行卡識別為例,目前合合信息的銀行卡識別廣泛應(yīng)用于全球的支付行業(yè),合作伙伴包括三星、eBay、支付寶,翼支付等國內(nèi)外的知名支付公司。在與三星的合作過程中,合合信息銀行卡識別準(zhǔn)確度高達99.9%,并且可以支持全球范圍內(nèi)的銀行卡識別。在國內(nèi),超過80%的券商在證件識別領(lǐng)域都選擇了合合信息作為其供應(yīng)商。

在To C領(lǐng)域,合合信息早在2009年就推出了第一款運用文本智能處理技術(shù)的移動應(yīng)用——名片全能王,這也是全球第一個將模式識別技術(shù)運用到手機上的APP,目前在全球名片全能王擁有3.2億用戶,另一款文本掃描識別APP掃描全能王,則擁有3.7億用戶,其中80%都是海外用戶。To B領(lǐng)域,經(jīng)過多年的深耕,目前合合信息的STR技術(shù)已經(jīng)成熟運用于金融、銀行、保險等領(lǐng)域。而要讓機器讀“懂”人類的語言,除了做好入口的文本識別,語言語義分析技術(shù)的實現(xiàn)也是必不可少的一環(huán)。合合信息擁有名片、財報、企業(yè)三證、合同、外賣小票等一百多個識別模塊,攻克了語言判斷、文字識別、版面理解、語義理解等多道難題,讓機器像人類一樣,動態(tài)實時學(xué)習(xí)更新。

正是出于對文本智能處理技術(shù)的極致追求,方成就了今天合合信息在該領(lǐng)域全球領(lǐng)先的地位。從名片識別、文檔識別,到如今的一百多個模塊識別,七百多億條企業(yè)數(shù)據(jù),合合一步一個腳印,通過STR+Data+AI的行業(yè)解決方案,賦能保險、證券、酒店、物流、o2o等行業(yè),

助力企業(yè)縮減人員成本、提高行業(yè)效率。

分享最后,龍騰博士將多年深耕在人工智能領(lǐng)域的經(jīng)驗總結(jié)為一句話:

“垂直領(lǐng)域,扎深扎透。

日積月累,必成江河。”