12月19日,由中國科學院《互聯(lián)網(wǎng)周刊》、中國社會科學院信息化研究中心、eNet研究院共同主辦的2019中國互聯(lián)網(wǎng)經(jīng)濟論壇在京舉行,廣東微模式軟件股份有限公司董事長陳友斌在現(xiàn)場發(fā)表了精彩的演講。陳友斌先生分享了現(xiàn)階段人工智能技術給我們的生活帶來的積極影響,以及未來還有哪些潛在的問題和值得關注的地方。
以下為演講實錄:
各位嘉賓,大家下午好,我是微模式軟件的陳友斌。今天來參加第十七屆2019互聯(lián)網(wǎng)經(jīng)濟論壇,我想跟大家簡單分享一下人工智能技術在最近幾十年,特別是最近的五年的飛速發(fā)展。包括技術給我們的生活帶來的積極影響。以及,未來還有哪些潛在的問題和值得關注的地方。
人工智能確實給現(xiàn)在的生活帶來了很多的便捷,包括剛才51Tolk介紹的在線教育。在線教育中的智能化因素很多,比如說學生做題的時候,拿手機一拍就可以在互聯(lián)網(wǎng)上找出最佳答案。這里牽扯到手機拍照的時候要把文字識別出來,普通的文字行還比較好辨認,但是有一些帶著公式、手寫的、表格、壓線,或者拍的不清晰、變形、陰影、變形等都是難題。
在線教育里面還有語音識別,一問一答的時候,如果是一個機器在自動教學,它要跟學生對話,它要理解學生在說什么,回答的問題是不是正確,這個也是很有難度的。難度在哪里呢?
首先,以中文來說,我們有很多方言。
其次,即使大家說普通話,普通話也有不標準的地方。
所以語音識別也是一個難題。
當然,在線教育里面還有更多的挑戰(zhàn),包括自然語言的理解、大數(shù)據(jù),人工智能確實給我們的生活帶來了很多便捷,我們很多家庭已經(jīng)用了幼教機器人、掃地的機器人。挖煤、挖礦等很多高危職業(yè),現(xiàn)在都可以用機器人和無人機去幫助人完成這些工作。這都是積極的方面,它使得我們的生活更便利,使得我們的生活更豐富多彩。
現(xiàn)在,大家在消費的時候,都習慣了用支付寶和微信掃碼。掃碼本身就是圖像識別,識別二維碼里面的內(nèi)容。我們用微信、支付寶掃碼有一個很好的體驗,就是不管手機距離的遠近,只要能拍到二維碼,模糊也能夠變清晰,角度傾斜也能矯正為矩形,這都是技術智能化發(fā)揮的作用。
最近,很多人在用刷臉支付,買東西、吃飯刷個臉就行了。我們坐高鐵、飛機登機等很多地方都在刷臉。
人工智能減少了工作成本,文字識別,以前我們的財務人員拿到各種票據(jù)的時候,要用手工通過鍵盤把上面的金額信息、各種消費信息、票據(jù)號碼、開票的單位名稱手工錄入到電腦里面去,很累。今天,我們有很多票據(jù)信息,拿掃描儀一掃,它把所有的字都認出來,減少了人工的煩惱。所以它提高效率、降低成本、解放勞動力。
在最近的幾年,尤其是最近的五年以來,人工智能、機器學習尤其是深度學習的飛速發(fā)展,帶動了人工智能在過去幾十年沒解決的難題逐步得到了解決。有的已經(jīng)徹底解決,有的得到很大的緩解,包括圖像識別、語音識別、視頻的一些行為分析等。我們最近半年或者最近一年來在人臉識別、智能交通、自動駕駛、智能家居、在線教育等等,還有智慧醫(yī)療、智慧樓宇、智慧園區(qū)等等很多地方的應用,都是人工智能的進步給我們帶來的便利。
在座的可能有一些工作單位以前考勤是按指紋的,現(xiàn)在可能改成刷臉了。刷臉分幾個不同的檔次,有的是要人配合,有的在你一進電梯它就能抓取你的臉部信息,是全程無感的。所以我們現(xiàn)在很多單位在研究無感的通行,智慧通行。
智慧醫(yī)療也是,以前我們在醫(yī)院里做檢查、拍片子要排隊,拍完了以后要等專家、醫(yī)生看,診斷?,F(xiàn)在有很多企業(yè)研究人工智能的深度學習,患者在拍完片子以后,通過機器學習能夠自動診斷,而且很多情況下,機器做的判斷非常準確。包括遠程醫(yī)療,一點點小毛病沒必要起大早到醫(yī)院排隊、掛號、看醫(yī)生,很多問題可以通過遠程醫(yī)療、遠程診斷解決。這些都是技術的進步。
我們微模式的團隊主要在研究圖像識別技術的應用。我們有一個16字方針:防范風險、提高效率、降低成本、解放人力。微模式的工作主要是圍繞這幾個詞進行,我們研究文字識別、人臉識別、車輛識別、視頻分析、各種真?zhèn)舞b別。
我可以大膽地告訴各位,對于現(xiàn)在的大學生選專業(yè),我個人認為選擇人工智能,在未來的10年-20年,這個領域很好就業(yè),而且大有可為。據(jù)不完全統(tǒng)計,我們國家未來的5年,大概人工智能的人才缺口很大,在500萬左右。而且,搞人工智能這方面的人才薪資待遇會比較好,這會是一個充滿機遇的領域。
在人工智能還面對著很多難題,難題在哪里呢?盡管它給生活帶來了便捷,但是還處于弱智能的階段,可能還不如一個3歲、5歲的小孩,目前為止它只能完成一些機械的工作,做一些重復性的勞動。但是可以預見,未來一些高危的工作可以用人工智能來取代。
我來稍微講一講人臉識別、語音識別和文字識別的一些應用。
人臉識別在坐高鐵、進飛機場、住酒店或者是考勤等場景的應用非常多,北京的某些地鐵也開始實行刷臉進站;語音識別也飛速發(fā)展,導航儀能聽懂你說的話,它可以根據(jù)你的意圖來改變導航的方式方法;文字識別就應用更多,我們拿手機拍各種證件、各種考卷,這都是很多很好的應用。
人臉識別在最近這些年發(fā)展非常迅速,解決了不少問題,但是也還是有很多問題沒有解決,比如說當你出現(xiàn)半邊臉、“陰陽臉”、人臉光照不均、姿態(tài)存在很大問題、圖像不清晰的時候,都會導致人臉識別產(chǎn)生錯誤。
更廣義的圖像識別不僅僅是人臉識別,包括車輛識別、特定目標的識別、視頻里面行為的分析還有語義的理解,這些都給我們帶來了困難,但是人工智能的發(fā)展到現(xiàn)在還有很多問題沒有解決。
語音識別的問題在于方言識別,還有普通話不標準、語速、語調(diào)、情感等影響因素,這些都可能給智能的設備與系統(tǒng)帶來困難。
人工智能的發(fā)展除開算法層級以外,應用層級也有很多,包括云計算,還有很多的算法做到前端到邊緣計算。我們做到設備、做到攝像頭、做到麥克風、做到這些感知的地方去了。
這些都證明了人工智能未來的前景很好,但是也給我們帶來很多苦惱。比如,我們發(fā)現(xiàn)在新聞里、在微信朋友圈里,有一些人用人工智能的手段改變你的臉。比如我在這里講話,有錄音錄像資料,有人可以很快把我的臉換成另外一個人的,并且非常逼真。
所以,我們國內(nèi)的監(jiān)管機構(gòu)對于這種搞笑的,或者是故意捉弄人的視頻,必須要在顯著的位置上標注這是合成或者模仿的,否則就要追責了,我們國家可能未來還會立法。
這就是技術創(chuàng)造出的很多苦惱,謠言伴隨技術而來,還有圖有真相,你不知道圖是用智能的手段編出來的,造假造出來的,這就很麻煩。
人工智是一把雙刃劍,刷臉確認身份給人們帶來便捷,但是也有很多存在隱患的地方需要注意。它很便捷,但是你有沒有想到刷臉支付和銀行卡、和你的身份證、和你的電話號碼、和你的住址很多信息是綁定的。一旦你的臉被人家盜了怎么辦?你說你的密碼被人家盜了可以改密碼,你的臉被人家盜了怎么辦?所以隱私保護是一個很重要的問題。
還有一些責任、倫理的問題,比如無人駕駛汽車,這個車撞了人找誰追責?做算法的人不能說我永遠做不了百分之百,它就是誤判。造車的人說我就是做算法。用車的人說你自己用的不是我讓你用的?,F(xiàn)在有很多地方做陪護的機器人、聊天的機器人,如果你們家里有一個機器人能夠通過情感計算,跟你對話把主人氣死了,那你的責任找誰?
這些倫理道德的問題、責任的問題,還有隱私保護問題,所有的這些都是未來的挑戰(zhàn),一個是法律方面要加強,另外一個就是發(fā)明一些手段甄別偽造的證據(jù)。
未來,微模式要把人工智能圖像識別用在金融領域,還有安防領域、平安校園、智慧校園,以及智慧樓宇這些東西。
以上是我演講的全部內(nèi)容,謝謝各位!