AI輔助孤獨癥兒童個性化干預,大米和小米最新研究成果在重要期刊發布
對一名孤獨癥兒童進行能力水準評估并制定個性化干預方案,需要多久?
過去,專業督導梁琳婕需要用3個小時,她任職于國內領先的特殊需要兒童康復機構大米和小米,這個用時也代表了國內一線督導的水準。
而現在,這一過程已經被壓縮到50分鐘以內,未來還會更短,而且準確性不下降。
近日,嶺南師范學院廣東省特殊兒童發展與教育重點實驗室李清華教授團隊與深圳市復米健康科技有限公司(大米和小米),共同在《現代特殊教育》雜志2024年11月刊上發表論文《基于大語言模型的孤獨癥兒童課程本位智能評估的循證研究》,該期刊創辦于1992年,是全國第一份正式出版的特殊教育專業期刊,也是發行量最大的特殊教育刊物。
該研究指出,基于大語言模型(LLM)對孤獨癥兒童功能進行智能評估,其Jaccard指數(一致性指數)可達72%(基于較早期的取樣結果)。這個智能評估在數據輸入后只要1分鐘即可生成,專業督導在AI生成基礎上再做復核和調整,整體50分鐘內可以完成,準確性和過去3小時人工完成的報告相當。
該智能評估作為行業內的首度原創性嘗試,極大提升了孤獨癥兒童的評估干預效率。
可實現優秀評估師經驗的數字化復制和傳承
論文中的這個智能評估,是大米和小米研發的AI解決方案RICE AI中的應用之一——AI評估師。根據論文所描述,RICE AI在參考其他領域的同類型研究設計的基礎上,結合孤獨癥兒童康復領域的真實場景需求和數據,進行針對性的建模和訓練,以達到評估和輸出個別化干預方案的效果。
隨后,通過373個新樣本的測試,將智能評估結果及生成的個性化干預方案,與專業評估師的判斷進行比對,從而評價其準確率。
結果表明,Jaccard整體指數為72%,也就是說,智能評估結果及生成的個性化干預方案與專業評估師的判斷和方案,相似度達到72%。
與60月齡的ASD(孤獨癥)兒童評估結果對比,該評估針對24-48月齡幼齡個案的Jaccard指數要顯著優異。此外,Jaccard指數并沒有因ASD兒童的性別和是否有診斷結果而存在顯著差異。
“我們希望探索人工智能領域的大語言模型在孤獨癥評估、康復流程上的應用,最終將部分人工的工作交由大語言模型去產出,并且質量和關聯度要和專業的評估師有較大的一致性?!闭撐牡谝蛔髡?、嶺南師范學院廣東省特殊兒童發展與教育重點實驗室教授李清華表示。
論文作者之一、大米和小米研發副總裁王占偉解釋,智能評估輸出較為準確的干預模板后,評估師可結合實際與孩子的互動觀察及家長的反饋,進一步微調和優化,從而很好地節省時間精力,并實現優秀評估師經驗的數字化復制和傳承。而且隨著算法的成熟,最新的后臺監測數據顯示準確度已經超過80%,未來準確率還將持續提高。
AI的有效應用,對實現康復普惠具里程碑意義
AI評估師根據孤獨癥兒童信息進行評估并輸出個性化干預方案,涵蓋評估結果與分析、干預目標、干預計劃等維度,再由評估師進行審核和微調,大大減輕人工撰寫報告的工作量。
整體用時可從3小時下降到50分鐘。
左:通過紙筆記錄數據、撰寫評估報告;右:AI一鍵生成評估報告
據2024年《中國孤獨癥教育康復行業發展狀況報告》保守估計,全國0至14歲孤獨癥兒童約200萬,且每年新增約16萬。孤獨癥群體“千人千面”,每個兒童的癥狀和需求都是獨特的,而個性化評估是科學干預的前提。
傳統的孤獨癥評估,很大程度上依賴于專業督導的個人能力和經驗,這一過程耗時耗力,極大影響了督導的工作效率。
“AI在這個領域被有效應用后,能極大降低對人力的依賴,對實現康復普惠具有里程碑意義?!蓖跽紓ソ榻B,該項目從2023年籌備立項,運用了大米和小米過去10年積累的20000多個案的8000多萬組干預記錄、200多萬干預標簽以及200多萬督導決策數據,海量實操數據是項目能夠研發成功的“地基”。
李清華認為,該項目具有較重大的科學創新和臨床應用價值,打開了孤獨癥康復和人工智能結合的研究可能和方法路徑,同時在研發過程中整個團隊堅持產學研結合,很好地實現了從研發到應用的無縫對接。
“理想的目標是評估方案能達到90%甚至更高的準確率。此外,隨著數據學習和模型的成熟,智能系統很有可能輸出評估師意想不到、但確實有用的恰當干預目標?!闭撐淖髡咧辉商聿┦恐赋?。
王占偉表示,研究團隊還在進一步嘗試將該技術應用在多動癥、言語障礙的評估,也在考慮引入多模態模型(語音語義識別、圖像和視頻識別),提升干預流程的效率和效能。