伊人丁香狠狠色综合久久,日韩欧美精品综合久久,亚洲精品老司机综合影院,成人免费一级在线播放

      伊人丁香狠狠色综合久久,日韩欧美精品综合久久,亚洲精品老司机综合影院,成人免费一级在线播放

      科研進(jìn)展

      心理所構建漢語(yǔ)語(yǔ)言產(chǎn)生數據庫

      發(fā)布時(shí)間:2024-02-22 作者:屈青青、馮臣

      近日,中國科學(xué)院心理研究所馮臣助理研究員、屈青青研究員及合作者在Nature旗下的Scientific Data發(fā)表漢語(yǔ)語(yǔ)言產(chǎn)生數據庫——A dataset of behavioral measures on Chinese word production in picture naming。

      說(shuō)話(huà),看似毫不費力,但其實(shí)是人類(lèi)最復雜的認知活動(dòng)之一。過(guò)去幾十年,研究者們試圖澄清言語(yǔ)表達(又稱(chēng)為“語(yǔ)言產(chǎn)生”)背后的認知架構和動(dòng)態(tài)加工過(guò)程。世界上大約有7000種語(yǔ)言,不同語(yǔ)言的詞匯、語(yǔ)音、字形系統大相徑庭?,F有的實(shí)證研究與理論框架主要基于印歐語(yǔ)系。與印歐語(yǔ)言不同,漢語(yǔ)有獨特之處:漢語(yǔ)屬于漢藏語(yǔ)系,是一種聲調語(yǔ)言,同一個(gè)音節的不同音調表示不同的詞匯與意義,大多數印歐語(yǔ)言則不使用聲調來(lái)區分詞義。其次,印歐語(yǔ)言采用字母拼寫(xiě)系統,而漢語(yǔ)采用非字母書(shū)寫(xiě)系統。另外,漢語(yǔ)的語(yǔ)音與字形的對應關(guān)系較為復雜,例如,聲音/shu/可以對應“書(shū)”、“梳”、“樹(shù)”或“薯”等多個(gè)不同的字形)。漢語(yǔ)研究對回答跨語(yǔ)言普遍性和特異性具有獨特價(jià)值和貢獻。的確,一些研究已經(jīng)表明,音位是印歐語(yǔ)言語(yǔ)音編碼的主要加工單元,而音節是漢語(yǔ)語(yǔ)音編碼的主要加工單元(O’Seaghdha et al., 2010)。

      然而,目前大部分關(guān)于語(yǔ)言產(chǎn)生的研究側重于印歐語(yǔ)言,而對于漢語(yǔ)這一非印歐語(yǔ)言的研究則相對有限。此外,這些研究主要關(guān)注于口語(yǔ)產(chǎn)生過(guò)程,對于書(shū)寫(xiě)等字形產(chǎn)生的關(guān)注則明顯不足。同時(shí),許多研究依賴(lài)于較小的樣本量和有限的實(shí)驗刺激,這可能導致統計效力不足和研究結果的可重復性問(wèn)題。構建漢語(yǔ)語(yǔ)言產(chǎn)生數據庫的需求與日俱增。

      此次發(fā)表的漢語(yǔ)語(yǔ)言產(chǎn)生數據庫記錄了667名被試在7種不同語(yǔ)言產(chǎn)生任務(wù)中的約20萬(wàn)個(gè)試次的反應時(shí)間,以及實(shí)驗材料的多個(gè)語(yǔ)言學(xué)變量(如:詞頻、字頻、音節頻率、習得年齡等)。該數據庫為研究漢語(yǔ)口語(yǔ)和書(shū)寫(xiě)產(chǎn)生的語(yǔ)言加工提供了豐富數據資源,為探索漢語(yǔ)產(chǎn)生的普遍性與特異性提供了數據基礎。此外,該數據庫對于開(kāi)發(fā)漢語(yǔ)語(yǔ)言產(chǎn)生的人工智能模型具有獨特價(jià)值與貢獻,有望推動(dòng)語(yǔ)言認知科學(xué)與人工智能領(lǐng)域的交叉與共同進(jìn)步。

      圖1.(a) 數據庫所包含詞匯的詞頻分布;(b)不同實(shí)驗任務(wù)下的反應時(shí)分布特征(右,單位:秒)

      注:圖a中,左側為該數據庫中包含詞匯的詞頻分布,右側為CLDC詞匯庫(Chinese Linguistic Data Consortium,現代漢語(yǔ)通用詞表)中的詞頻分布。在數據庫中,詞頻的分布與大型詞匯庫相似,顯示出廣泛的分布范圍。圖b展示了不同實(shí)驗任務(wù)和范式的反應時(shí)間(以秒為單位),平均反應時(shí)間介于450毫秒至1500毫秒之間。使用相同實(shí)驗范式的實(shí)驗呈現出相似的反應時(shí)間分布,而不同范式的實(shí)驗反應時(shí)間分布則顯示出較大的差異。實(shí)驗材料較少的實(shí)驗,如cyclic blocking paradigm,其反應時(shí)間更快且分布更集中;而實(shí)驗材料較多的實(shí)驗,如simple picture naming,其反應時(shí)間較慢且分布更廣。

      該數據庫發(fā)表在Scientific Data。第一作者為心理所馮臣助理研究員,通訊作者為屈青青研究員。該數據庫已共享在OSF repository(https://doi.org/10.17605/OSF.IO/6GTZH),并通過(guò)心理科學(xué)數據銀行發(fā)布。

      該研究得到了國家自然科學(xué)基金(No. 32171058, No. 31771212 and No. 62061136001),北京市科技新星項目、中國科協(xié)青年人才托舉項目(YESS20200138)、中國科學(xué)院青年創(chuàng )新促進(jìn)會(huì )項目,中國科學(xué)院心理研究所“揭榜掛帥”項目以及中國科學(xué)院行為科學(xué)重點(diǎn)實(shí)驗室的支持(Y5CX052003)。

      論文信息:

      Feng, C., Damian, M.F. & Qu, Q.* (2024). A dataset of behavioral measures on Chinese word production in picture naming.?Scientific Data,?11, 185. https://doi.org/10.1038/s41597-024-03022-8



      附件下載: