照片是Facebook和其他社交媒體平臺上最常見的共享內(nèi)容之一。
盡管大多數(shù)社交媒體用戶都可以理解圖片并理解圖片的含義,但對于盲人或視力障礙者而言,這并不是一件容易的事。
Facebook表示,屏幕閱讀器可以使用合成語音來描述這些圖片的內(nèi)容,從而使盲人或視力障礙的用戶能夠理解Facebookfeed中的圖片。
但是,許多照片在發(fā)布時都沒有替代文本,導致Facebook在2016年引入了自動替代文本(AAT)。
這項技術(shù)使用對象識別技術(shù)為盲人或視障用戶按需生成照片描述。
自2016年以來,F(xiàn)acebook一直致力于改善AAT,并于近期推出了下一代技術(shù)。
Facebook在AAT方面的進步改善了用戶的照片體驗,而AAT可以可靠地檢測和識別照片中的概念數(shù)量已擴展了十倍以上。
這意味著更少的沒有描述的照片和更詳細的描述。
AAT可以識別活動,地標,動物類型等。
AAT現(xiàn)在將給出以下描述:“它可能是兩個人的自拍照,在戶外,比薩斜塔”。
Facebook還表示,能夠在照片中包含有關(guān)元素的潛在位置和相對大小的信息是業(yè)界首創(chuàng)。
它并沒有簡單地描述“可能是五個人的合影”。
但是,由于“兩個人在照片的中央,而其他三個人分散在邊緣”。
Facebook表示,這項進步可以幫助盲人或視障用戶更好地了解家人和朋友發(fā)布的照片??中的內(nèi)容。
最新版本的AAT使用對數(shù)十億張公共Instagram圖片和標簽數(shù)據(jù)進行訓練的模型。
訓練后產(chǎn)生的模型在文化和人口統(tǒng)計方面更準確,更寬容。
改進的AAT可以可靠地識別1200多個概念。
負責編輯AJX