伊人丁香狠狠色综合久久,日韩欧美精品综合久久,亚洲精品老司机综合影院,成人免费一级在线播放

      科研進(jìn)展

      心理所創(chuàng )建中文閱讀眼動(dòng)數據庫Chinese Eye-Movement Database

      發(fā)布時(shí)間:2022-07-21 作者:中國科學(xué)院行為科學(xué)重點(diǎn)實(shí)驗室 李興珊研究組

        “眼睛是心靈的窗戶(hù)”?,F代認知科學(xué)表明,眼睛的運動(dòng)和大腦內部的認知活動(dòng)存在緊密聯(lián)系。在心理學(xué)領(lǐng)域,眼動(dòng)追蹤技術(shù)為揭示人類(lèi)高級認知過(guò)程的心理機制提供了重要途徑。在過(guò)去的20年中,大量的實(shí)驗研究采用眼動(dòng)追蹤技術(shù)考察了中文閱讀的認知機制,并取得了豐碩的成果。然而,大多數實(shí)驗研究受到被試量和實(shí)驗刺激數量的限制,很難滿(mǎn)足當前大數據技術(shù)和人工智能的發(fā)展。因此,建構包含大樣本的中文閱讀眼動(dòng)數據庫的需求與日俱增。

        基于過(guò)去十余年的研究,中國科學(xué)院行為科學(xué)重點(diǎn)實(shí)驗室李興珊研究組的科研人員建立了大規模的中文閱讀眼動(dòng)數據庫——Chinese Eye-Movement Database。該數據庫包含來(lái)自57項中文句子閱讀實(shí)驗的眼動(dòng)數據(共計1718名被試、8015個(gè)中文句子、近140萬(wàn)個(gè)注視點(diǎn)),計算了8551個(gè)中文詞的九項眼動(dòng)指標(建構流程如圖1所示)。統計分析顯示,該數據庫可以復現以往研究中經(jīng)典的詞頻與詞長(cháng)效應,即讀者對較低頻或較長(cháng)的詞加工更困難,從而產(chǎn)生更多的回視和更長(cháng)的注視時(shí)間。

      圖1. 詞切分與眼動(dòng)指標計算流程圖

      注:圖1a為單個(gè)句子中的詞切分流程,圖1b為單個(gè)詞匯(如“沙漠”)上的某項眼動(dòng)指標,如“首次注視時(shí)間”(First Fixation Duration, FFD)的計算流程

        該數據庫具有廣泛的應用前景:

        在中文閱讀的認知機制研究中,研究者可直接利用該數據庫檢驗相關(guān)的理論假設,節約經(jīng)濟和時(shí)間成本;同時(shí),該數據庫可以為建立中文閱讀計算模型提供基準數據,幫助其進(jìn)行參數尋優(yōu)。

        在跨語(yǔ)言研究領(lǐng)域,該數據庫可與其他語(yǔ)言中的同類(lèi)數據庫進(jìn)行對比,考察不同語(yǔ)言閱讀機制的一致性和特異性。

        在人工智能領(lǐng)域,自然語(yǔ)言處理的模型大量使用了與注意相關(guān)的機制(如為不同詞匯分配不同的權重或激活狀態(tài)),而眼動(dòng)數據則為這種注意的分配提供了直接參考;大量研究表明,將眼動(dòng)數據納入自然語(yǔ)言處理模型,能夠有效提升模型的任務(wù)表現(如詞性標注、句法分析、文本理解等)。因此,本文提出的數據庫將為優(yōu)化中文自然語(yǔ)言處理模型提供重要的數據資源。

        該數據庫中報告的詞匯的眼動(dòng)指標可作為反映詞匯閱讀加工難度的指標,幫助研究者更好地控制和操縱實(shí)驗研究中閱讀材料的難度,并有助于為不同閱讀能力的讀者匹配合適的閱讀材料。

        綜上所述,該數據庫將為中文閱讀認知機制的大數據研究提供重要支撐,促進(jìn)該領(lǐng)域的發(fā)展,也將為人工智能領(lǐng)域的模型開(kāi)發(fā)與訓練提供數據基礎,促進(jìn)人工智能與認知科學(xué)的融合發(fā)展。

        該研究受?chē)易匀豢茖W(xué)基金(31970992,31871105)和國際(地區)合作與交流項目(NSFC 62061136001/DFG TRR-169)的共同資助。相關(guān)成果已在線(xiàn)發(fā)表于Nature旗下的數據期刊Scientific Data,第一作者為心理所博士研究生張光耀,通訊作者為林楠副研究員與李興珊研究員。數據庫所涉及的全部原始注視點(diǎn)數據、實(shí)驗材料,以及數據分析代碼已全部通過(guò)Open Science Framework 共享。

        隨著(zhù)數據驅動(dòng)的科研范式的形成,研究所越來(lái)越重視心理學(xué)研究中的科學(xué)數據工作,正在積極建設中國科學(xué)院心理研究所科學(xué)數據中心。該數據庫未來(lái)也可通過(guò)心理科學(xué)數據銀行(https://www.scidb.cn/psych)申請使用。

        論文信息:

        Zhang, G., Yao, P., Ma, G., Wang, J., Zhou, J., Huang, L., Xu, P., Chen, L., Chen, S., Gu, J., Wei, W., Cheng, X., Hua, H., Liu, P., Lou, Y., Shen, W., Bao, Y., Liu, J., Lin, N.*, & Li, X.* (2022). The database of eye-movement measures on words in Chinese reading. Scientific Data. https://doi.org/10.1038/s41597-022-01464-6

        相關(guān)文章:

        Li, X.*, Huang, L., Yao, P. & Hy?n?, J. (2022). Universal and specific reading mechanisms across different writing systems. Nature Reviews Psychology, 1, 133–144. https://doi.org/10.1038/s44159-022-00022-6

        Li, X.*, & Pollatsek, A. (2020). An integrated model of word processing and eye-movement control during Chinese reading. Psychological Review, 127(6), 1139–1162. http://dx.doi.org/10.1037/rev0000248

       


      附件下載: