要學(xué)習(xí)語(yǔ)言,要踏入人類(lèi)集體智慧的大門(mén),孩子們需要交流,大量的交流。
不難想象,在未來(lái),父母在孩子睡前給他蓋被子時(shí),可以用一個(gè)APP來(lái)講睡前故事,同時(shí)還可以吸引孩子進(jìn)行溫和的對(duì)話。或者是,幼兒園老師不再把一大群孩子趕到地毯上圍成一圈,而是給每個(gè)孩子準(zhǔn)備一個(gè)平板電腦,根據(jù)孩子的詞匯量、語(yǔ)言水平和注意力程度來(lái)教授課程。
兒童擁有大語(yǔ)言模型所不具有的超強(qiáng)能力
機(jī)器生成的語(yǔ)言和人的語(yǔ)言對(duì)兒童大腦的是否有相同的影響呢?答案并不是那么顯而易見(jiàn)。關(guān)鍵在于兒童的學(xué)習(xí)方式與聊天機(jī)器人的學(xué)習(xí)方式截然不同。二者的本質(zhì)區(qū)別在于,聊天機(jī)器人的學(xué)習(xí)方式完全來(lái)自語(yǔ)言數(shù)據(jù)庫(kù),而兒童的學(xué)習(xí)方式則來(lái)自使用語(yǔ)言的人。
大型語(yǔ)言模型(LLMs),如 ChatGPT 背后的模型,需要學(xué)習(xí)大量的數(shù)據(jù),才能辨別出語(yǔ)言的統(tǒng)計(jì)模式。兒童也有進(jìn)行統(tǒng)計(jì)學(xué)習(xí)的能力。
但是兒童有一種大語(yǔ)言模型缺乏的超能力。從一開(kāi)始,兒童的語(yǔ)言學(xué)習(xí)就是社會(huì)性的,是在與教他們的人的密切關(guān)系中發(fā)展起來(lái)的。這就提高了兒童學(xué)習(xí)的效率。人們有意識(shí)地使用語(yǔ)言,努力使彼此的想法保持一致,即使最小的孩子對(duì)此也深有體會(huì)。
有一個(gè)很經(jīng)典的實(shí)驗(yàn),給 16 到 19 個(gè)月大的幼兒玩一個(gè)玩具,同時(shí)把另一個(gè)物體塞進(jìn)一個(gè)桶里,藏在幼兒看不見(jiàn)的地方。當(dāng)孩子注視著手中的玩具時(shí),大人說(shuō):“這是一個(gè)玩具——Modi”正常的孩子不會(huì)認(rèn)為這個(gè)人說(shuō)的是他手里拿著的這個(gè)玩具,而是會(huì)根據(jù)說(shuō)話者的視線去尋找,將說(shuō)話者注意的東西和這句話聯(lián)系起來(lái)。
寶寶們明白說(shuō)話者的目的在于把他們的注意力吸引到說(shuō)話者關(guān)注的東西上面。之后再讓他們辨認(rèn)“Modi”時(shí),他們更多地是選擇桶里的東西,這說(shuō)明他們已經(jīng)把這個(gè)詞和這個(gè)東西聯(lián)系起來(lái)了。
在沒(méi)有明顯交流意圖的情況下,孩子們很難把聽(tīng)到的詞和看到的東西聯(lián)系起來(lái)。例如當(dāng)孩子注視著一個(gè)物體時(shí),揚(yáng)聲器里傳來(lái)一個(gè)單詞,孩子就不會(huì)把這個(gè)詞映射到這個(gè)物體上。僅有相關(guān)性是不夠的,兒童需要的是正面的反饋。在這方面,即使是機(jī)器人做的可能也不夠好。一項(xiàng)研究報(bào)告指出,雖然兒童能夠跟隨機(jī)器人目光所及之處,并注意到機(jī)器人觀察的對(duì)象,但是卻很難記住機(jī)器人觀察的對(duì)象的名稱(chēng)。
不難看出,判斷說(shuō)話者交流意圖的能力對(duì)提高語(yǔ)言學(xué)習(xí)的效率多么有幫助。它能讓兒童縮小注意力的范圍,忽略眼中的世界與聽(tīng)到的語(yǔ)言之間的許多虛假關(guān)聯(lián),而這正是人工智能目前必須通過(guò)蠻力計(jì)算才能解決的問(wèn)題。
但是,這種社會(huì)性很強(qiáng)的學(xué)習(xí)形式也有風(fēng)險(xiǎn)。有些說(shuō)話者并不可靠,他們可能會(huì)誤導(dǎo)或直接欺騙你。如果你的大部分認(rèn)知都是基于他人的言行,而不是你自己的所見(jiàn)所聞,那么明智的做法是對(duì)這些東西進(jìn)行一些過(guò)濾。
盡管孩子們渴望向身邊能說(shuō)會(huì)道的大人們學(xué)習(xí),但他們?cè)趯W(xué)習(xí)過(guò)程中也會(huì)帶著一些懷疑態(tài)度。如果說(shuō)話者之前犯了一個(gè)明顯的錯(cuò)誤,比如把蘋(píng)果叫做“狗”,那么他們就不太可能接受一個(gè)新詞或新事實(shí)。如果說(shuō)話者在表達(dá)不確定性時(shí)說(shuō):“嗯,我以前從沒(méi)見(jiàn)過(guò)這種東西。我覺(jué)得這叫‘blick’”,他們就會(huì)不愿意向這樣的人學(xué)習(xí)。比起從未見(jiàn)過(guò)的老師,他們更愿意向熟悉的老師學(xué)習(xí)。
簡(jiǎn)但來(lái)說(shuō),他們不會(huì)一味地吸收周?chē)恼Z(yǔ)言,而是會(huì)衡量說(shuō)話者的水平——我能相信這個(gè)人有能力嗎?無(wú)論是從年齡、自信心,或是句子的復(fù)雜程度,穿著打扮來(lái)判斷,說(shuō)話者越有權(quán)威,孩子就越容易向他們學(xué)習(xí)。有證據(jù)表明,說(shuō)話者與孩子屬于同一個(gè)社會(huì)群體——屬于同一個(gè)民族、有著同樣的口音,甚至有著相同的膚色——都會(huì)增加孩子向他們學(xué)習(xí)的意愿。
當(dāng)孩子們與一個(gè)聽(tīng)起來(lái)像人類(lèi),但卻無(wú)法準(zhǔn)確辨別其善惡的人工智能互動(dòng)時(shí),會(huì)發(fā)生什么?基于大語(yǔ)言模型的人工智能在根本上不存在意識(shí)或情感,但是這些人工智能交流的過(guò)程中卻又好像充滿(mǎn)情感,這是因?yàn)橛?xùn)練這些人工智能的語(yǔ)言數(shù)據(jù)總是具有人類(lèi)的情感的。但是,人工智能的語(yǔ)言和內(nèi)心狀態(tài)之間存在著根本性的脫節(jié)。
目前正在開(kāi)發(fā)的一些人工智能工具認(rèn)識(shí)到,兒童需要的是互動(dòng),而不僅僅是語(yǔ)言環(huán)境。語(yǔ)言與技術(shù)學(xué)者徐穎和她的同事們開(kāi)發(fā)了一款為兒童講述圖書(shū)的機(jī)器人,同時(shí)還能與兒童進(jìn)行對(duì)話,討論人物的動(dòng)機(jī)或者接下來(lái)劇情的發(fā)展方向。
但是,我們對(duì)兒童與人工智能互動(dòng)的理解還處于早期階段,落后于技術(shù)本身的發(fā)展。大部分研究都是針對(duì)Siri等不太復(fù)雜的語(yǔ)音助手,或根據(jù)腳本工作的“社交”機(jī)器人進(jìn)行的,對(duì)于兒童如何回應(yīng)由大語(yǔ)言模型驅(qū)動(dòng)的更復(fù)雜的對(duì)話機(jī)器人,幾乎還沒(méi)有任何研究。
語(yǔ)言的分配并不公平
隨著孩子們語(yǔ)言環(huán)境的改變,新的問(wèn)題產(chǎn)生了。就像我們社會(huì)中的很多東西一樣,語(yǔ)言的分配并不公平。富裕的父母往往有更多的時(shí)間與孩子交談,他們可以負(fù)擔(dān)得起更高質(zhì)量的托兒服務(wù)。幾十年的研究表明,許多家庭經(jīng)濟(jì)條件較差的孩子不太可能接觸到豐富多彩的互動(dòng)性的語(yǔ)言。
這些差異對(duì)孩子發(fā)展是有影響的。兒童的語(yǔ)言發(fā)展依賴(lài)于他們所處的環(huán)境,反過(guò)來(lái),根據(jù)兒童詞匯量和所掌握語(yǔ)法的復(fù)雜程度來(lái)衡量他們進(jìn)入幼兒園時(shí)的語(yǔ)言技能,也能預(yù)測(cè)他們?nèi)蘸蟮膶W(xué)業(yè)成績(jī)。
語(yǔ)言學(xué)習(xí)是社會(huì)性的,根植于人與人的關(guān)系中
不過(guò)研究表明,兒童對(duì)人工智能的理解與成年人不同,他們傾向于把機(jī)器人人格化,并賦予它們意識(shí)。這樣做實(shí)際上有助于強(qiáng)化學(xué)習(xí)。