連日來,國內(nèi)外IT圈關于人工智能各種勁爆消息不絕于耳,先是騰訊微信義無反顧地革了Microsoft小冰的命,其次震驚世界的EugeneGoostman圖靈測試,再者百度挖來“谷歌大腦之父”吳恩達(AndrewNG),又傳三星收購NUANCE……各種有關人工智能的大企競合突發(fā)事件開始井噴出現(xiàn)。那么,國內(nèi)高新技術企業(yè)又是如何應對這一系列突發(fā)事件的呢?
捷通靈云敢為天下先,中國人工智能產(chǎn)業(yè)先行者
作為中國人工智能領域的老牌高新技術民族企業(yè),駐扎在北京中關村軟件園的捷通華聲語音技術有限公司自20世紀末成立伊始就開始專研于語音和手寫等智能人機交互技術領域,隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展和社會網(wǎng)絡化需求的變化,如今捷通華聲已延伸出語音識別(ASR)、語音合成(TTS)、圖像識別(OCR)、手寫識別(HWR)、自然語言理解(NLU)、機器翻譯(MT)等六大技術能力,形成獨特的“全智能”效應,并為奧運會、世博會、海陸空交通、金融銀行等領域,及上千種移動端APP提供全方位智能人機交互技術服務。
2011年,捷通華聲全面整合具有自主知識產(chǎn)權的多項智能人機交互技術,突破性地創(chuàng)建了第一個最大最全的智能人機交互技術云服務開放平臺——靈云(www.hcicloud.com),率先拉開了中國人工智能產(chǎn)業(yè)化的大幕!
2014年伊始,人工智能的熱潮在幾大互聯(lián)網(wǎng)巨頭的推波助瀾中不斷洶涌,各廠商提到的“人工智能”主要集中在智能計算方面,例如百度的“百度大腦”計劃,目的是利用計算機模擬人腦拉升它的智力水平,使計算機在未來能夠和人類對等交流,提供更準確、高效的服務。其實,人工智能是一個由淺入深的智能化模型、機制和過程,在較淺層次上,人工智能意味著智能化的人機交互方式,在深層次上,人工智能意味著基于機器學習技術的知識表達、歸納、推理等智能計算過程。智能人機交互是人工智能的觸角,智能計算是人工智能的核心,二者缺一不可,共同組成一個智能網(wǎng)絡。捷通靈云智能平臺自誕生以來,憑借優(yōu)異的靈云智能語音交互技術讓計算機實現(xiàn)“能說會聽”、出眾的靈云圖像識別技術讓各種數(shù)字設備“能寫能看”,而靈云語義理解、機器翻譯已經(jīng)突破人機交互的表層,向人工智能深層次挺進。2013年,捷通華聲得到了清華大學的鼎力支持,共同致力于實現(xiàn)“靈云科技、源自清華、服務全球”戰(zhàn)略規(guī)劃,共同促進中國人工智能在學術與產(chǎn)業(yè)中的發(fā)展進步。
在清華大學電子系、計算機、信研院等院系各人工智能頂尖學科團隊的支持下,捷通靈云智能語音等人機交互能力更加成熟。靈云語音識別,采用最新深度神經(jīng)網(wǎng)絡算法技術,識別準確率突破95%,并已在國內(nèi)客服語音質(zhì)檢、IVR語音導航、移動互聯(lián)網(wǎng)應用等領域?qū)崿F(xiàn)全面普及性應用;語音合成方面,捷通靈云在國內(nèi)率先推出支持中、英、德、法、阿拉伯等多達十三種國際語言的語音合成技術服務,在國內(nèi)智能語音服務達到了50%的市場占有率,而靈云“聽與說”兩項能力的強化,讓人與機器的自然交流變得更加通暢。
靈云OCR與手寫識別等智能圖像識別技術,猶如人的“眼睛與手”。目前靈云手寫識別已能夠識別92種國際語言;靈云OCR更是在文檔、票據(jù)、證照識別領域中異軍突起,在不斷完善OCR多樣化應用的同時,捷通華聲也正在清華大學的支持下開發(fā)更完善的圖像識別技術,除了支持票證、證照、文本的識別,還將陸續(xù)推出圖片、人臉識別等更多元化的圖像識別技術,保證靈云擁有更全面的“視覺與感觀”能力。
人類無論用語音交互還是通過文字傳遞信息,其獲取信息的目的則是為了在相互理解之后進行彼此的溝通。捷通靈云智能平臺即將全面升級并推出的語義分析、意圖理解及機器翻譯,進一步推動靈云向人工智能更深層次發(fā)展,不僅讓靈云“能說會聽”、“能寫會看”,也要開始學會思考。其中,語義理解等自然語言理解技術就是讓靈云擁有了思考的能力,例如通過靈云語音識別不在僅是聽懂人的話,同時能夠?qū)λR別出的文字信息進行分析理解,然后應用靈云語音合成技術將所要表達的信息以語音方式朗讀出來,從而實現(xiàn)靈云人工智能的一個完美應用過程。捷通華聲近期推出的靈云智能客戶服務系統(tǒng),全面應用靈云語義理解、語音交互等能力,在國內(nèi)智能客服、機器人服務等領域獨樹一幟,并成功為廣發(fā)、中信等數(shù)十家金融領域客戶提供了全面智能客戶服務。
隨著人工智能在互聯(lián)網(wǎng)產(chǎn)業(yè)中關注度越來越高,人工智能似乎一夜間成為產(chǎn)業(yè)的熱點,捷通靈云智能平臺憑借對人工智能產(chǎn)業(yè)發(fā)展的獨特理念與執(zhí)著信心,終于逐漸顯現(xiàn)出其超前魄力的魅力。
捷通華聲創(chuàng)始人張連毅表示:“捷通靈云智能平臺的創(chuàng)建與發(fā)展,不僅有力推動智能人機交互技術在中國的發(fā)展與普及化應用,產(chǎn)業(yè)的需求、技術的跨越式進步也推動靈云智能平臺完成向多模態(tài)、全方位智能人機交互能力服務平臺的升級與發(fā)展。如果說捷通華聲是中國人工智能產(chǎn)業(yè)的倡導者,那么捷通靈云智能平臺就是中國人工智能產(chǎn)業(yè)的先行者。”
捷通靈云智能平臺——多模態(tài)、全方位服務產(chǎn)業(yè)
捷通華聲靈云智能開放平臺自2013年向社會全面開放以來,靈云語音識別(ASR)、語音合成(TTS)、圖像識別(OCR)、手寫識別(HWR)、自然語言理解(NLU)、機器翻譯(MT)等六大技術能力得到產(chǎn)業(yè)界、開發(fā)者的廣泛認同,并助力百度導航、搜狗導航、導航犬、嘀嘀打車、快的打車,天行聽書、漢字英雄成為家喻戶曉的移動經(jīng)典應用。靈云能力服務也讓超過3億社會大眾輕松體驗到智能人交互技術的服務,感受人工智能無限的魅力。
捷通靈云智能開放平臺之所以得到產(chǎn)業(yè)界的廣泛支持,不僅得益于捷通華聲所始終倡導的“合作共贏”的合作理念,靈云智能平臺已囊括目前人工智能產(chǎn)業(yè)中最實用的多項能力,給企業(yè)合作伙伴、開發(fā)者提供了“要啥有啥”的便捷與舒適。靈云智能平臺的三大特色也為合作伙伴、開發(fā)者提供了施展才華,全面展現(xiàn)其產(chǎn)品的創(chuàng)新與輕松使用的實力。首先,捷通靈云智能平臺是中國目前最大最全的智能人機交互技術交流和體驗平臺——并免費開放,所以無論技術宅還是企業(yè)工程師都可在這里自由調(diào)用,盡情發(fā)揮想象與創(chuàng)造力;而靈云智能平臺“云+端”服務形成靈云獨特的優(yōu)勢,“云+端”服務可為企業(yè)提供更加合適并實時更新的智能人機交互技術解決方案;還有就是,靈云智能平臺的實時創(chuàng)新與互動——是由捷通華聲一線技術人員負責,所有最新技術均保證第一時間更新至靈云平臺,為所有客戶提供及時高效的服務。
捷通華聲未來發(fā)展,捷通靈云智能平臺將在不斷增加各種智能人機交互能力的基礎上,逐步推出更寬廣的人機交互能力與更深層次的人工智能能力,充分發(fā)揮移動互聯(lián)網(wǎng)、云計算服務之優(yōu)勢,真正推動人工智能技術服務產(chǎn)業(yè)、服務社會,推動人工智能產(chǎn)業(yè)成為中國IT領域中最具創(chuàng)新力的產(chǎn)業(yè)力量。
中國人工智能前景展望
當被記者問及如何看待國內(nèi)人工智能發(fā)展的時候,捷通華聲CEO張連毅先生饒有興致地回復道:“近些年來,中國IT界軟硬件都發(fā)生了巨變,面對國內(nèi)外掀起的人工智能熱潮,及智能移動終端、智慧城市、智能汽車、智能家居等幾乎覆蓋所有產(chǎn)業(yè)的智能化趨勢,在這個全新并充滿想象的產(chǎn)業(yè)中,中國企業(yè)不要早言或輕言誰是大腕誰又是巨頭,又是想著誰領導誰。中國信息產(chǎn)業(yè)應該說已具備了廣泛且堅實的人工智能技術研發(fā)的經(jīng)濟基礎和技術基礎,產(chǎn)業(yè)界同仁應共同努力,推動人工智能為實現(xiàn)中國完成‘中國制造’向‘中國創(chuàng)造’產(chǎn)業(yè)進步做出貢獻,并激發(fā)中國年青的一代IT人擁有成為世界信息產(chǎn)業(yè)領導者的勇氣與力量。”
人工智能專家雷·庫茲韋爾(raykurzweil)曾在暢銷書《奇點臨近》中預言強人工智能的研究將迅速崛起(強人工智能是具備了像人一樣的思考能力,弱人工智能則是行為語言看起來像人),并在2045年跨越人工智能超過人類智能的“奇點”,他甚至表示,技術奇點的加速模型顯示,21世紀就是人類文明的終點,換句話說,現(xiàn)在出生的人們,將在有生之年看到“終極科技”。
對于這種觀點,張連毅先生在最后不無幽默地表示:“人的本性都有些“懶”,人類的創(chuàng)造發(fā)明都是服務“懶”,如今不要說汽車,就是自行車也比人跑得快。因此,只要人類的本性不變,人類的文明就不會終止,機器再聰明也會如同汽車,得人來開!“
靈云簡介:捷通靈云智能開放平臺(www.hcicloud.com)是捷通華聲全力打造的人工智能技術云服務平臺。靈云是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數(shù)字設備的網(wǎng)絡云服務,其目標是讓人機交互像人與人溝通一樣的簡單自然。靈云目前以“云+端”方式,為用戶提供語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)和自然語言理解(NLU)、機器翻譯(MT)等多項核心技術能力,是目前國內(nèi)能力最全、服務最廣的專業(yè)人工智能技術云服務平臺。2013年,捷通華聲與清華大學建立戰(zhàn)略合作伙伴關系,共同實現(xiàn)“靈云科技、源自清華、服務全球“的戰(zhàn)略發(fā)展目標。