第104章(1 / 1)
“跨语种时,第一选择当然是英语。原以为会更慢,没想到只用了1/20的时间。事后想来这是必然的:万国宝把各种汉语中的‘人’发音连起来之后,已经向上抽象了一层。在那里,它有了一个概念,虽然它还无法用其它词语表述。但摸到英语时它很快发现下面连接的都是类似的语境,于是在上面那一层直接建立连接!语法对它来说根本不存在,它对‘相似’或者‘同义’的判断,根据来源于底层的底层:真实世界。
“从语言到文字的连接更是快得出乎意料。我终于明白了王博士的直觉:文字本身就是符号化的、经过抽象的语音。它介于我们定义的第一层和第二层之间,不能用来打地基。然而,我们在头一年咬牙磨出来的原始连接,被文字插在中间双向传导,整个概念网络的扩展速度提高了一个数量级。
“2032年团队全体放大假,王博士带我们去语言学家的天堂——新几内亚玩。在岛上,当地的土著和她又给了我几道闪电。
“第一道是和土著强行交谈时被闪到的。我和土著一对一,两个人连说带比,半天也没什么进展。比如我指着自己说‘我’,他怎么知道我的意思是人称代词,是名字,是‘你的主人’,还是‘文明的灯塔’?然而双方三对三,效率立即提高几十倍。我可以指一圈:‘我’、‘你’、‘他’、‘他’、‘他们’。这样一搞,双方还立即明白了汉语第三人称只有单数复数,而土著语有单数、双数和三数。在这之前,我们出于谨慎,真人实验网络规模都比较小。回国后我就大肆扩张,寻找一切机会让万国宝吸收大人群的数据。最狠的一招是单向连接了全国中学生用来学英语的手机ai。那个ai本身很差,但它的原始数据无价,每天18小时不限量供应。
“在岛上王博士就笑话我:人群网络越大,两种语言自然通译越快。这是语言学的abc,我怎么捡着当宝贝?但我也有她没注意到的领悟:那根用来指人的手指。
“回去之后,我招了一组人研究tensorflow上谷歌透镜模式识别的内核架构,把它做成标准附件,强制万国宝连接语言时用这个识别器同时处理情景中的图像和视频。网购平台本身还有个常备手指:当前宝贝——sorry,当前商品。现在除了语境匹配,加上了数据量大得多的情景匹配。我们又摘了果子,网络向上生长的效率又提高了几十倍……”
技术代表们哗然,似乎都瞬间打通了任督二脉。国务卿脸上见汗,瞟了戈德曼一眼,奇怪这种人为什么没有早点死绝。
“最后、最大的一道闪电,还是王博士炸出来的。各位第一次听说她的大名,多半是因为新王码。后来新王码被……边缘化了。2029年她重开老课题,没有经费,才需要找工作。她的精力在项目组用不完,老课题进展也很大:人类语言的隐喻体系。论文我就不背诵了。总之,我躺在岛上读,突然明白了大脑的另一个秘密。显而易见的秘密,但是当年霍金斯都没反应过来。
“类比是大脑网络构建的基本形式。前面我们说了,大脑的统一数据格式是组合序列。它怎么知道把谁跟谁横向连起来?结构相似的就连起来啊!相似的细胞组合,相似的神经冲动发生序列。隐喻是语言生长的基本形式。美国人吸毒吸高兴了,中国人喝酒喝高兴了,都叫‘high’或者‘高了’。这是方位隐喻,从百万年前就有的方位概念派生而来。英语把银行叫bank,所以把货币叫currency,把存钱叫deposit。这是连贯隐喻,从一组事物的机理构建另外一组。比喻是每个人的第一修辞手段,已经从底层的无意识上升为有意识。我们用类比思考,用隐喻扩展概念和语言,再倒过来用语言塑造大脑。(注:bank的原意是“堤坝”,currency的原意是“水流”,deposit的原意是“沉淀”。)
“我们对相似、类比、隐喻的依赖深入骨髓,统治我们每一种思维活动、每一种智力表现。我们不喜欢跟已知世界模型完全相同的信息,那叫重复,大脑的反应是厌倦、疲劳;我们也不喜欢完全找不到模板的信息,那叫陌生,大脑的反应是迷惑、恐惧。我们热爱的是相似:大部分相同,让大脑轻松理解;有一点区别,让连接再次延伸。这一点区别,就像dna复制中的误差,就像生物每一代的变异,是我们智慧的根本、创造力的源泉、上升的原动力。
“为什么我们都热爱音乐?音乐就是节奏序列大体相同,频率序列大体相似,但每一段、每一阶稍有变化。大脑最享受的体操,全员起舞。不信你把八度音阶的频率稍微改一点,不是前一阶的正好两倍,听听有多难受。为什么我们觉得美人的脸美?以前统计的学者说是因为对称,只说对一半。不信你找张美人图,把任意半边脸对折过去合成,看它怪不怪。大脑认为在对称的基础上稍有变化最美。过分对称的美女,知道给自己插上一朵鬓边花,点上一颗美人痣!”
乌玛·瑟曼和她的完全对称脸
礼堂的空气中充满电荷。一重又一重的隐喻,一波又一波的类比,穿透已知和未知的壁垒。一颗大脑在解释自身。诡异的递归行为变成汹涌的智力喷发,所有听众都吓到了。没人忍心鼓掌打断他,没人敢出声把他拉回议程的方向。
“在座诸位,很多是人类中最有创造力的。你们问问自己,你最得意的创造,所有的创造,是从头做起全新的套路?还是把已有的东西、前人的智慧研究透彻,把成功的模式抄下来,把其它领域的精华构造搬过来,然后改变那关键的一点,试一试?戈德曼博士,质粒网为什么叫质粒网?” ↑返回顶部↑
“从语言到文字的连接更是快得出乎意料。我终于明白了王博士的直觉:文字本身就是符号化的、经过抽象的语音。它介于我们定义的第一层和第二层之间,不能用来打地基。然而,我们在头一年咬牙磨出来的原始连接,被文字插在中间双向传导,整个概念网络的扩展速度提高了一个数量级。
“2032年团队全体放大假,王博士带我们去语言学家的天堂——新几内亚玩。在岛上,当地的土著和她又给了我几道闪电。
“第一道是和土著强行交谈时被闪到的。我和土著一对一,两个人连说带比,半天也没什么进展。比如我指着自己说‘我’,他怎么知道我的意思是人称代词,是名字,是‘你的主人’,还是‘文明的灯塔’?然而双方三对三,效率立即提高几十倍。我可以指一圈:‘我’、‘你’、‘他’、‘他’、‘他们’。这样一搞,双方还立即明白了汉语第三人称只有单数复数,而土著语有单数、双数和三数。在这之前,我们出于谨慎,真人实验网络规模都比较小。回国后我就大肆扩张,寻找一切机会让万国宝吸收大人群的数据。最狠的一招是单向连接了全国中学生用来学英语的手机ai。那个ai本身很差,但它的原始数据无价,每天18小时不限量供应。
“在岛上王博士就笑话我:人群网络越大,两种语言自然通译越快。这是语言学的abc,我怎么捡着当宝贝?但我也有她没注意到的领悟:那根用来指人的手指。
“回去之后,我招了一组人研究tensorflow上谷歌透镜模式识别的内核架构,把它做成标准附件,强制万国宝连接语言时用这个识别器同时处理情景中的图像和视频。网购平台本身还有个常备手指:当前宝贝——sorry,当前商品。现在除了语境匹配,加上了数据量大得多的情景匹配。我们又摘了果子,网络向上生长的效率又提高了几十倍……”
技术代表们哗然,似乎都瞬间打通了任督二脉。国务卿脸上见汗,瞟了戈德曼一眼,奇怪这种人为什么没有早点死绝。
“最后、最大的一道闪电,还是王博士炸出来的。各位第一次听说她的大名,多半是因为新王码。后来新王码被……边缘化了。2029年她重开老课题,没有经费,才需要找工作。她的精力在项目组用不完,老课题进展也很大:人类语言的隐喻体系。论文我就不背诵了。总之,我躺在岛上读,突然明白了大脑的另一个秘密。显而易见的秘密,但是当年霍金斯都没反应过来。
“类比是大脑网络构建的基本形式。前面我们说了,大脑的统一数据格式是组合序列。它怎么知道把谁跟谁横向连起来?结构相似的就连起来啊!相似的细胞组合,相似的神经冲动发生序列。隐喻是语言生长的基本形式。美国人吸毒吸高兴了,中国人喝酒喝高兴了,都叫‘high’或者‘高了’。这是方位隐喻,从百万年前就有的方位概念派生而来。英语把银行叫bank,所以把货币叫currency,把存钱叫deposit。这是连贯隐喻,从一组事物的机理构建另外一组。比喻是每个人的第一修辞手段,已经从底层的无意识上升为有意识。我们用类比思考,用隐喻扩展概念和语言,再倒过来用语言塑造大脑。(注:bank的原意是“堤坝”,currency的原意是“水流”,deposit的原意是“沉淀”。)
“我们对相似、类比、隐喻的依赖深入骨髓,统治我们每一种思维活动、每一种智力表现。我们不喜欢跟已知世界模型完全相同的信息,那叫重复,大脑的反应是厌倦、疲劳;我们也不喜欢完全找不到模板的信息,那叫陌生,大脑的反应是迷惑、恐惧。我们热爱的是相似:大部分相同,让大脑轻松理解;有一点区别,让连接再次延伸。这一点区别,就像dna复制中的误差,就像生物每一代的变异,是我们智慧的根本、创造力的源泉、上升的原动力。
“为什么我们都热爱音乐?音乐就是节奏序列大体相同,频率序列大体相似,但每一段、每一阶稍有变化。大脑最享受的体操,全员起舞。不信你把八度音阶的频率稍微改一点,不是前一阶的正好两倍,听听有多难受。为什么我们觉得美人的脸美?以前统计的学者说是因为对称,只说对一半。不信你找张美人图,把任意半边脸对折过去合成,看它怪不怪。大脑认为在对称的基础上稍有变化最美。过分对称的美女,知道给自己插上一朵鬓边花,点上一颗美人痣!”
乌玛·瑟曼和她的完全对称脸
礼堂的空气中充满电荷。一重又一重的隐喻,一波又一波的类比,穿透已知和未知的壁垒。一颗大脑在解释自身。诡异的递归行为变成汹涌的智力喷发,所有听众都吓到了。没人忍心鼓掌打断他,没人敢出声把他拉回议程的方向。
“在座诸位,很多是人类中最有创造力的。你们问问自己,你最得意的创造,所有的创造,是从头做起全新的套路?还是把已有的东西、前人的智慧研究透彻,把成功的模式抄下来,把其它领域的精华构造搬过来,然后改变那关键的一点,试一试?戈德曼博士,质粒网为什么叫质粒网?” ↑返回顶部↑