<a href="https://mashdigi.com/google-launches-more-accessibility-features-using-ai-to-enhance-screen-reader-analysis-and-interaction/" title="https://mashdigi.com/google-launches-more-accessibility-features-using-ai-to-enhance-screen-reader-analysis-and-interaction/" ><span style="color:#808080;">【此文章來自:Mashdigi】</span></a><br /> <br /> 在蘋果因應 5 月 16 日的全球無障礙體認日 (Global Accessibility Awareness Day) 推出<a href="https://mashdigi.com/apple-adds-accessibility-labels-to-the-app-store-mac-can-also-use-the-magnifying-glass-function-and-supports-braille-access-and-barrier-free-readers/" title="https://mashdigi.com/apple-adds-accessibility-labels-to-the-app-store-mac-can-also-use-the-magnifying-glass-function-and-supports-braille-access-and-barrier-free-readers/" >諸多無障礙功能</a>後,Google 也同樣在全球無障礙體認日推出<a href="https://blog.google/outreach-initiatives/accessibility/android-gemini-ai-gaad-2025/" title="https://blog.google/outreach-initiatives/accessibility/android-gemini-ai-gaad-2025/" >多款在 Android、Chrome 的無障礙功能</a>。<br /> <br /> <img src="https://timgm.eprice.com.tw/tw/mobile/img/2025-05/16/5815904/eprice_1_80b84269dd31fa4c912b207d8370e320.jpg" title="Google 推出更多無障礙功能,藉由 AI 加強螢幕閱讀器的分析、互動功能" alt="Google 推出更多無障礙功能,藉由 AI 加強螢幕閱讀器的分析、互動功能" border="0" / /><br /> <br /> <!-- for ePriceTW --> <ins class="adsbygoogle" data-ad-client="ca-pub-9386838430591421" data-ad-slot="7238007871" style="display:inline-block;width:728px;height:90px"> </ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script><br /> <br /> 其中,Google 將 Gemini 人工智慧技術整合至 Android 螢幕閱讀器「TalkBack」功能內,即使螢幕顯示內容沒有具體文字內容,依然可透過人工智慧方式生成圖像描述,甚至也能進一步針對描述內容進行提問,例如可回答圖像中人物穿著細節、穿戴配件等,另外也能透過此功能查詢購物服務呈現商品的材質、是否有額外折扣等。<br /> <br /> <img src="https://timgm.eprice.com.tw/tw/mobile/img/2025-05/16/5815904/eprice_1_059f57bb902b06ea056beed00e056463.jpg" title="Google 推出更多無障礙功能,藉由 AI 加強螢幕閱讀器的分析、互動功能" alt="Google 推出更多無障礙功能,藉由 AI 加強螢幕閱讀器的分析、互動功能" border="0" / /><br /> <br /> 而在新版「Expressive Captions」字幕功能,則是進一步利用人工智慧技術分析影片中人物說話語氣,並且讓生成字幕透過額外描述方式詮釋更多「情緒」,例如當賽事講解人員激動表達進球時高喊「精彩得分」時,生成字幕會在後續加上「~~~~!」之類的標點符號,或是加上相關聲音標籤,藉此呈現不同解說情緒,讓更多聽障者透過字幕也能感受講解人員當下激動情緒。<br /> <br /> 不過,此功能將僅先針對英語使用地區提供,包含美國、英國、加拿大、澳洲境內搭載 Android 15 以上的裝置均可使用。<br /> <br /> <img src="https://timgm.eprice.com.tw/tw/mobile/img/2025-05/16/5815904/eprice_1_a7e959738a4cb5d6d1b8ae1b8a782470.jpg" title="Google 推出更多無障礙功能,藉由 AI 加強螢幕閱讀器的分析、互動功能" alt="Google 推出更多無障礙功能,藉由 AI 加強螢幕閱讀器的分析、互動功能" border="0" / /><br /> <br /> 藉由 2019 年啟用的「Euphonia」項目,讓非當地語言使用者也能順利使用語音辨識功能,例如讓非英語使用者在使用生澀的英語發音下達聲控指令時,依然可讓語音辨識功能正常識別運作。而「Euphonia」項目目前已經透過 GitHub 提供開源程式碼資源,讓更多人可以打造客製化應用服務,或是訓練不同語音識別效果。<br /> <br /> 另外,Google 也透過其 Google.org 單位協助英國倫敦大學學院創建數位語言包容中心 (CDLI),改善非洲非英語使用者的語音辨識技術,其中建立 10 種非洲語言的開源資料集,並且建立新語音辨識模型,使其能應用在更多語音識別應用服務。<br /> <br /> 其他更新部分,則包含加入可讓身障者透過臉部表情操作 Chromebook,並且在閱讀模式加入更多自訂選項,同時也能透過螢幕閱讀器「TalkBack」功能檢視螢幕顯示內容,或是透過字幕觀看影片,而透過 OCR 光學字元辨識技術更讓 Chrome 瀏覽器能更容易識別 PDF 文件內容,甚至能進一步選取、複製或搜尋 PDF 文件的文字內容,另外也能透過自動放大效果,讓視障者更容易透過 Chrome 瀏覽器檢視網頁內容。<br /> <br /> <img src="https://timgm.eprice.com.tw/tw/mobile/img/2025-05/16/5815904/eprice_1_a7e959738a4cb5d6d1b8ae1b8a782470.jpg" title="Google 推出更多無障礙功能,藉由 AI 加強螢幕閱讀器的分析、互動功能" alt="Google 推出更多無障礙功能,藉由 AI 加強螢幕閱讀器的分析、互動功能" border="0" / /><br />
在蘋果因應 5 月 16 日的全球無障礙體認日 (Global Accessibility Awareness Day) 推出諸多無障礙功能後,Google 也同樣在全球無障礙體認日推出多款在 Android、Chrome 的無障礙功能。
其中,Google 將 Gemini 人工智慧技術整合至 Android 螢幕閱讀器「TalkBack」功能內,即使螢幕顯示內容沒有具體文字內容,依然可透過人工智慧方式生成圖像描述,甚至也能進一步針對描述內容進行提問,例如可回答圖像中人物穿著細節、穿戴配件等,另外也能透過此功能查詢購物服務呈現商品的材質、是否有額外折扣等。
而在新版「Expressive Captions」字幕功能,則是進一步利用人工智慧技術分析影片中人物說話語氣,並且讓生成字幕透過額外描述方式詮釋更多「情緒」,例如當賽事講解人員激動表達進球時高喊「精彩得分」時,生成字幕會在後續加上「~~~~!」之類的標點符號,或是加上相關聲音標籤,藉此呈現不同解說情緒,讓更多聽障者透過字幕也能感受講解人員當下激動情緒。
不過,此功能將僅先針對英語使用地區提供,包含美國、英國、加拿大、澳洲境內搭載 Android 15 以上的裝置均可使用。
藉由 2019 年啟用的「Euphonia」項目,讓非當地語言使用者也能順利使用語音辨識功能,例如讓非英語使用者在使用生澀的英語發音下達聲控指令時,依然可讓語音辨識功能正常識別運作。而「Euphonia」項目目前已經透過 GitHub 提供開源程式碼資源,讓更多人可以打造客製化應用服務,或是訓練不同語音識別效果。
另外,Google 也透過其 Google.org 單位協助英國倫敦大學學院創建數位語言包容中心 (CDLI),改善非洲非英語使用者的語音辨識技術,其中建立 10 種非洲語言的開源資料集,並且建立新語音辨識模型,使其能應用在更多語音識別應用服務。
其他更新部分,則包含加入可讓身障者透過臉部表情操作 Chromebook,並且在閱讀模式加入更多自訂選項,同時也能透過螢幕閱讀器「TalkBack」功能檢視螢幕顯示內容,或是透過字幕觀看影片,而透過 OCR 光學字元辨識技術更讓 Chrome 瀏覽器能更容易識別 PDF 文件內容,甚至能進一步選取、複製或搜尋 PDF 文件的文字內容,另外也能透過自動放大效果,讓視障者更容易透過 Chrome 瀏覽器檢視網頁內容。