前言
近年來,物聯(lián)網(wǎng)、云計算和大數(shù)據(jù)的迅猛發(fā)展使得數(shù)據(jù)呈現(xiàn)指數(shù)級增長,智能文字識別作為文檔數(shù)據(jù)管理的核心技術(shù),迎來良好發(fā)展機遇。2022 年我國智能文字識別市場規(guī)模已超50億元,預計2027年我國智能文字識別市場規(guī)模接近170億元,2022-2027年年復合增長率達27.3%。
按照下游客戶類型及交付形式,智能文字識別服務可分為 C 端標準化產(chǎn)品、B端標準化產(chǎn)品、B 端基礎技術(shù)服務、B 端場景化解決方案四種形式。伴隨下游個人用戶和企業(yè)客戶對文檔資產(chǎn)數(shù)字化與智能化升級需求的驅(qū)動下,我國智能文字識別各類型細分市場均保持較高增速。從下游領域看,制造業(yè)、金融、物流等對智能文字識別技術(shù)需求較大,是智能文字識別技術(shù)的主要應用領域。
從競爭情況看,C端競爭方面,智能文字識別類主流APP中掃描全能王先發(fā)優(yōu)勢優(yōu)勢明顯,處于行業(yè)領先地位。B端競爭方面,智能文字識別 B 端市場競爭參與者主要分為谷歌、百度、騰訊、阿里等綜合型 AI 廠商和合合信息、ABBYY等非綜合型 AI 廠商。非綜合型 AI 廠商和綜合型 AI 廠商有著不同的側(cè)重領域;且細分市場競爭格局存在差別,形成B 端差異化競爭。
一、智能文字識別正確率高于傳統(tǒng)文字識別,行業(yè)發(fā)展前景廣闊
根據(jù)觀研報告網(wǎng)發(fā)布的《中國智能文字識別行業(yè)發(fā)展趨勢分析與未來前景研究報告(2024-2031年)》顯示,智能文字識別是從圖像中識別出文字的技術(shù),利用機器將圖像中手寫或印刷文本轉(zhuǎn)化為計算機可以直接處理的格式。智能文字識別能夠處理不同場景的圖像,包括拍攝或掃描得到的各種卡證、紙質(zhì)文檔圖像,也包括含有文字的自然場景圖像和疊加了字幕文本的視頻圖像等。相比傳統(tǒng)文字識別,智能文字識別具有更強的認知能力和判別力,正確率更高,是個人數(shù)字資產(chǎn)管理及企業(yè)自動化辦公提升的重要工具。
資料來源:觀研天下整理
近年來,物聯(lián)網(wǎng)、云計算和大數(shù)據(jù)的迅猛發(fā)展使得數(shù)據(jù)呈現(xiàn)指數(shù)級增長,智能文字識別作為文檔數(shù)據(jù)管理的核心技術(shù),迎來良好發(fā)展機遇。根據(jù)數(shù)據(jù),2017年我國智能文字識別市場規(guī)模僅為6.1億元,至2022 年我國智能文字識別市場規(guī)模已超50億元,預計2027年我國智能文字識別市場規(guī)模接近170億元,2022-2027年年復合增長率達27.3%。
數(shù)據(jù)來源:觀研天下數(shù)據(jù)中心整理
二、智能文字識別服務內(nèi)容分為四類,預計未來均保持較高增速
按照下游客戶類型及交付形式,智能文字識別服務可分為 C 端標準化產(chǎn)品、B端標準化產(chǎn)品、B 端基礎技術(shù)服務、B 端場景化解決方案四種形式。伴隨下游個人用戶和企業(yè)客戶對文檔資產(chǎn)數(shù)字化與智能化升級需求的驅(qū)動下,我國智能文字識別各類型細分市場均保持較高增速。預計2022-2027年我國智能文字識別中基礎技術(shù)服務、標準化產(chǎn)品(C端)、標準化產(chǎn)品(B端)、場景化解決方案CAGR分別為16.5%、22.4%、30%、31.6%。
智能文字識別服務分類
服務 | 定義 | 產(chǎn)品形態(tài) | 下游客戶 |
基礎技術(shù)服務 | 智能文字識別所需要基礎性技術(shù)服務,通常服務于版式相對標準化的文檔、證件識別 | 各類證件識別,如身份證識別、駕照識別、銀行卡識別等技術(shù)授權(quán)預裝,如手機授權(quán)預裝等 | 下游客戶主要為具有一定開發(fā)能力的企業(yè)客戶 |
標準化產(chǎn)品(C端) | 基于智能文字識別技術(shù)所打造的標準化、可直接使用的產(chǎn)品 | C端產(chǎn)品文檔管理、名片管理APP部分辦公軟件中也提供智能文字識別功能 | C端產(chǎn)品下游客戶主要為C端個人消費者 |
標準化產(chǎn)品(B端) | 基于智能文字識別技術(shù)所打造的標準化的SaaS/PaaS產(chǎn)品 | B端產(chǎn)品面向B端的標準化產(chǎn)品,如名片管理企業(yè)版產(chǎn)品;智能文字識別各類服務相關的SaaS/PaaS產(chǎn)品 | B端產(chǎn)品對標準化SaaS/PaaS產(chǎn)品有需求的企業(yè),主要為中型企業(yè)或大型企業(yè)的部分部門 |
場景化解決方案 | 基于智能文字識別技術(shù)、產(chǎn)品,根據(jù)客戶場景化需求而開發(fā)的深度服務解決方案,以幫助B端用戶實現(xiàn)流程數(shù)字化與智能化升級 | AI機器人,如財報分析比對、合同內(nèi)容比對等AI訓練平臺,下游客戶可自行進行智能文字識別訓練 | 下游客戶主要為B端大型企業(yè)目前NLP等技術(shù)在醫(yī)療領域應用(如臨床決策輔助系統(tǒng)、病例質(zhì)控系統(tǒng)等)較為廣泛,所以目前場景化解決方案有較多醫(yī)療企業(yè)客戶 |
資料來源:觀研天下整理
數(shù)據(jù)來源:觀研天下數(shù)據(jù)中心整理
三、金融、物流等對智能文字識別技術(shù)需求相對較大,為行業(yè)主要下游應用領域
制造業(yè)、政府、房地產(chǎn)、物流、醫(yī)療健康、金融企業(yè)對業(yè)務流程方面的基礎信息化建設程度投入意愿相對較高,在證照、單據(jù)、表格等文檔的智能錄入、分類、比對、審核方面進行降本增效具有較大需求,是智能文字識別技術(shù)的主要應用領域。預計2020-2025年我國制造業(yè)、政府、房地產(chǎn)、物流、醫(yī)療健康、個人消費者、泛金融、其他領域智能文字識別市場規(guī)模CAGR分別為54.1%、49.4%、43.1%、36.5%、36.2%、33.8%、29.6%、25.7%。
數(shù)據(jù)來源:觀研天下數(shù)據(jù)中心整理
四、智能文字識別 APP 中掃描全能王發(fā)展領先,B端細分市場格局存在差異
從C端競爭看,智能文字識別類主流APP包括掃描全能王CamScanner、Officelens、GoogleLens、ABBYY FineScanner、AdobeScan、Scannable掃描寶,其中掃描全能王已經(jīng)在用戶規(guī)模、品牌知名度、用戶口碑等方面建立了先發(fā)優(yōu)勢,在文字識別 APP 領域保持行業(yè)領先地位。
文字識別類主流APP基本情況
APP | 簡介 | 上線時間 | 用戶數(shù)量 | 用戶體驗 |
掃描全能王CamScanner | 將智能手機變成便攜式掃描儀,采集、管理各種文檔產(chǎn)品,支持文檔圖片的智能切邊、智能圖像增強、票據(jù)/證照/表格等多種文檔的文字識別功能 | 2010 年 | 2023 年的平均月活為 14,540.4 萬 | iOS 中國區(qū)評分 4.9,評分個數(shù) 450.6 萬個iOS 美國區(qū)評分為 4.9,評分個數(shù) 126.3 萬個 |
Officelens | 微軟集團旗下的掃描與文字識別產(chǎn)品,可將圖像轉(zhuǎn)換為 PDF、Word、PowerPoint 或 Excel 文件,將打印或手寫文本數(shù)字化 | 2015 年 | 2023 年的平均月活為 1,269.6 萬 | iOS 中國區(qū)評分 4.9,評分個數(shù) 3.1 萬個iOS 美國區(qū)評分為 4.8,評分個數(shù) 10.7 萬個 |
GoogleLens | 微軟集團旗下的掃描與文字識別產(chǎn)品,可將圖像轉(zhuǎn)換為 PDF、Word、PowerPoint 或 Excel 文件,將打印或手寫文本數(shù)字化 | 2017 年 | 2023 年的平均月活為 2,488.1 萬 | Googlelens未在 AppStore 上架 |
ABBYY FineScanner | ABBYY 集團旗下開發(fā)的產(chǎn)品,可從掃描內(nèi)容中提取文本進行進一步編輯和共享 | 2012 年 | 2023 年的平均月活為 4.1 萬 | iOS 中國區(qū)評分 4.8,評分個數(shù) 0.7 萬個iOS 美國區(qū)評分為 4.7,評分個數(shù) 1.9 萬個 |
AdobeScan | Adobe 集團旗下開發(fā)的掃描與文字識別產(chǎn)品,能夠?qū)⑷魏渭堎|(zhì)文檔轉(zhuǎn)換為AdobePDF,同時具備 OCR 功能 | 2017 年 | 2023 年的平均月活為 6,623.6 萬 | iOS 中國區(qū)未上架iOS 美國區(qū)評分為 4.9,評分個數(shù) 123.6 萬個 |
Scannable掃描寶 | Evernote 印象筆記旗下的掃描與文字識別產(chǎn)品,可將紙質(zhì)文件掃描成圖片,并支持 OCR 文字識別,可無縫對接至印象筆記 | 2010 年 | 2023 年的平均月活為 48.9 萬 | iOS 中國區(qū)評分 4.9,評分個數(shù) 13.0 萬個iOS 美國區(qū)未上架 |
資料來源:觀研天下整理
從B端看,智能文字識別 B 端市場競爭參與者主要分為谷歌、百度、騰訊、阿里等綜合型 AI 廠商和合合信息、ABBYY等非綜合型 AI 廠商。
綜合型 AI 廠商旗下云平臺提供的 B 端服務范圍廣泛且多元,包含云服務器、云存儲、云數(shù)據(jù)庫、人臉識別、語音識別、視頻分發(fā)加速等相關產(chǎn)品,智能文字識別僅為其中一種產(chǎn)品。綜合型 AI 廠商切入 OCR 領域的主要原因是:基于其成熟的公有云 PaaS 平臺提供基礎化、標準化的 OCR 識別服務的邊際成本較低,拓展 OCR 業(yè)務的主要目的是進一步提升其云平臺服務的豐富度。但拓展場景化的解決方案市場需大量人力、研發(fā)投入配合客戶的個性化需求,項目周期也較長,邊際成本較高。而非綜合型 AI 廠商核心業(yè)務即為智能文字識別,但其在智能文字識別業(yè)務投入的人員與資金較為有限。
非綜合型 AI 廠商和綜合型 AI 廠商有著不同的側(cè)重領域,形成B 端差異化競爭。
智能文字識別B 端市場競爭參與者分類及其基本情況
類別 |
側(cè)重領域差異化 |
公司名稱 |
公司簡介 |
在智能文字識別領域的產(chǎn)品/服務 |
綜合型 AI 廠商 |
智能文字識別不是其主要核心業(yè)務 |
百度云 |
又稱“百度智能云”,是百度集團旗下的云服務平臺,創(chuàng)立于2015年。其專注云計算、智能大數(shù)據(jù)、人工智能服務,提供云服務器、云主機、云存儲、CDN、域名注冊、物聯(lián)網(wǎng)等云服務。 |
智能文字識別是百度云平臺提供的能力之一,以提供API/SDK標準化PaaS產(chǎn)品為主:近年開始布局場景化解決方案,2020年推出智能文字識別平臺TextMind:2021年上線EasyDLOCR智能文字識別模型自訓練平臺。 |
騰訊云 |
是騰訊集團旗下的云服務平臺,2013年創(chuàng)立。其提供云計算、大數(shù)據(jù)、人工智能服務,涵蓋云服務器、云數(shù)據(jù)庫、云存儲、視頻與CDN、域名注冊等全方位云服務和各行業(yè)解決方案。 |
智能文字識別是騰訊云平臺提供的能力之一,以提供API/SDK標準化PaaS產(chǎn)品為主。 |
||
阿里云 |
是阿里巴巴集團旗下云服務平臺,創(chuàng)立于2009年。其提供云服務器、云數(shù)據(jù)庫、云安全、云企業(yè)應用等云計算服務,以及大數(shù)據(jù)、人工智能服務、精準定制基于場景的行業(yè)解決方案。 |
智能文字識別是阿里云平臺提供的能力之一,以提供API/SDK標準化PaaS產(chǎn)品為主。 |
||
Google Cloud |
是Google 集團旗下的云計算服務平臺。其提供云計算、數(shù)據(jù)存儲、數(shù)據(jù)分析等一系列國際化的云服務。 |
Google Cloud平臺以提供API/SDK標準化PaaS產(chǎn)品為主,較少提供場景化解決方案。另外Google在C端APP有Google Lens產(chǎn)品。 |
||
非綜合型 AI 廠商 |
智能文字識別是其主要核心業(yè)務 |
ABBYY |
1989年創(chuàng)立,是一家提供PC和移動設備OCR、文檔識別軟件和計算機輔助語言學習軟件的國際軟件公司。ABBYY在世界各地通過區(qū)域和國際合作伙伴的廣泛網(wǎng)絡,產(chǎn)品已遠銷130多個國家。 |
B端服務方面包括基礎技術(shù)服務、標準化服務、場景化解決方案,客戶以國外客戶為主,C端產(chǎn)品包括ABBYYFineScanner、ABBYYBusiness Card Reader。 |
合合信息 |
公司成立于 2006 年。2016年公司將深度學習算法、自然語言處理技術(shù)與 OCR 技術(shù)相結(jié)合,自主研發(fā)智能文字識別技術(shù),大幅度提升了智能文字識別技術(shù)的性能和應用場景,并將 AI 技術(shù)落地成為產(chǎn)品級應用。 |
在 B 端業(yè)務方面,2016 年,公司正式成立企業(yè)級智能解決方案事業(yè)部,面向行業(yè)頭部客戶,輸出超過 100 種證照的 OCR 基礎模塊服務,布局文字識別 B 端企業(yè)服務領域。2017 年開始,公司針對不同行業(yè)復雜場景的文字識別進行更多元化的商業(yè)化探索,加速布局智能文字識別 AI 機器人、AI 訓練平臺等場景化解決方案。在 C 端產(chǎn)品方面,公司在 2010 年把握住了移動互聯(lián)網(wǎng)的高速發(fā)展機遇,上線了名片全能王、掃描全能王兩大產(chǎn)品,目前已在用戶數(shù)量、用戶體驗、核心技術(shù)等方面獨特的競爭優(yōu)勢。 |
資料來源:觀研天下整理
智能文字識別 B 端服務不同細分市場的競爭格局存在差異?;A技術(shù)服務市場參與者較多,包含智能文字識別廠商、傳統(tǒng)文字識別廠商、云服務平臺廠商等?;A技術(shù)服務存在一定程度的同質(zhì)化競爭。
標準化B端產(chǎn)品處于發(fā)展早期,由于打造標準化SaaS(軟件即服務)、PaaS(平臺即服務)產(chǎn)品的技術(shù)門檻較高,目前僅有少數(shù)企業(yè)布局,目前主要參與者為合合信息(提供SaaS產(chǎn)品服務)、少數(shù)云服務平臺(如阿里云、百度云、騰訊云等,提供PaaS服務)
由于場景化解決方案通常需要于客戶現(xiàn)場進行實施部署,因此具有區(qū)域性,市場分布較為分散。國內(nèi)幾大云平臺服務廠商及部分AI企業(yè)開始布局場景化解決方案,但是由于行業(yè)理解及業(yè)務場景落地能力需要長時間的經(jīng)驗積累,目前商業(yè)化落地案例較為有限。
B 端服務不同細分市場的競爭格局
B端細分市場 | 競爭情況 |
基礎技術(shù)服務 | 基礎技術(shù)服務市場參與者較多,包含智能文字識別廠商、傳統(tǒng)文字識別廠商、云服務平臺廠商等?;A技術(shù)服務存在一定程度的同質(zhì)化競爭。 |
標準化B端產(chǎn)品 | 標準化B端產(chǎn)品處于發(fā)展早期,由于打造標準化SaaS(軟件即服務)、PaaS(平臺即服務)產(chǎn)品的技術(shù)門檻較高,目前僅有少數(shù)企業(yè)布局,目前主要參與者為合合信息(提供SaaS產(chǎn)品服務)、少數(shù)云服務平臺(如阿里云、百度云、騰訊云等,提供PaaS服務) |
場景化解決方案 | 由于場景化解決方案通常需要于客戶現(xiàn)場進行實施部署,因此具有區(qū)域性,市場分布較為分散。國內(nèi)幾大云平臺服務廠商及部分AI企業(yè)開始布局場景化解決方案,但是由于行業(yè)理解及業(yè)務場景落地能力需要長時間的經(jīng)驗積累,目前商業(yè)化落地案例較為有限。 |
資料來源:觀研天下整理(zlj)
【版權(quán)提示】觀研報告網(wǎng)倡導尊重與保護知識產(chǎn)權(quán)。未經(jīng)許可,任何人不得復制、轉(zhuǎn)載、或以其他方式使用本網(wǎng)站的內(nèi)容。如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請?zhí)峁┌鏅?quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至kf@chinabaogao.com,我們將及時溝通與處理。