散文《我和DeepSeek过招的故事 》


作者:荆奇(肖尔)

 

1.  中国人工智能的创举

 

  2024年12月,中国的深度求索DeepSeek如晴天霹雳,横空出世。这个完全由几个中国年轻人在中国国内自主研发的人工智能会话软件,几天内,下载人数就超过千万,深得世界各国科技人士的喜爱,好评如潮,其大数据和超级算法,以及超级性价比,大大碾压了美国引以为傲的、先前发布的同类软件ChatGPT。顿时震撼了世界人工智能行业和世界科技界, 甚至波及世界政坛。

 

        这种基于大数据算法的人工智能会话软件,使用的人越多,它的性能就越强大。我国超多的人口基数和广大的科技力量,也成为DeepSeek的强大后盾。我就在DeepSeek发布的第一时间,下载了该软件,并且尽可能多地使用DeepSeek,还经常把它和ChatGPT进行比较。

         微软、谷歌和ChatGPT制造商OpenAI都要使用云计算,而云计算依赖于全球海量数据中心服务器内数以千计的芯片来训练被称为模型的AI算法,分析数据以帮助这些算法“学习”如何执行任务。ChatGPT的成功促使其他公司竞相推出自己的AI系统和聊天机器人,或者开发使用大型AI模型的产品。

         ChatGPT是以一般国家根本无法承受的海量耗电为基础的

 

        举两个例子来说明ChatGPT的开发、使用成本和耗电有多吓人:

        ChatGPT的上一代GPT3.0,光设备即需要1千张以上NVedia的GPU卡, ChatGPT 部署到谷歌进行的每次搜索中,需要 512820.51 台 A100 HGX 服务器和总共 4102568 个 A100 GPU,这些服务器和网络的总成本仅资本支出就超过 1000 亿美元。

        至于它的耗电,和接入费用,更是吓死人:

美国2021年发表的一篇研究论文显示,训练GPT-3一次需耗用1.287吉瓦时电量(1个吉瓦时等于1兆瓦时),大约相当于120个美国家庭1年的用电量,相当于阿根廷全国一年耗费的电量。同时,这样的一次训练会产生502吨碳,相当于110辆美国汽车1年的排放量。而且,这种训练只适用于一个程序,或者说是“模型”。这样的一次训练成本介于 200 万美元至 1200 万美元之间。当下任何一个国家想接入ChatGPT训练自己的AI模型都用不起。

        性能评价呢:目前ChatGPT在实际使用仍存在诸多问题,最典型的是回答内容的准确性不可控。如谷歌在2月6日展示旗下聊天机器人Bard,由于回答中生成了错误结果,导致其母公司Alphabet股价周三暴跌7.7%,短短两天,市值蒸发近1700亿美元。微软接入ChatGPT的搜索引擎“新Bing”上线一周多后问题不断,有用户测试发现,新版必应在某些情况下会出现“精神错乱的”言论,甚至侮辱用户、撒谎,并试图操纵用户的情绪。

 

         那么,相较于我们的DeepSeek呢,初期VC投资仅2000万美元,据悉开发成本仅160亿美元,而一次训练仅600万美元。难怪DeepSeek 刚一发布,美国就说是假新闻,而欧亚各国都争相启用,物美价廉到美国科技界难以置信。不过,使用后,连微软、Google都不得不承认,DeepSeek的性能和使用费用都大大优越过ChatGPT。

 

2.  北京市中学生数学竞赛

 

  中国传统寓言,就有个“猴子分花生的故事”,说得是,一个养猴子的人,对猴子们说,从今天起,我们改变每天分花生的方法,从每天中午发7颗花生,改为每天早晨三颗,晚上四颗。猴子们大吵大闹,大为不满。养猴人就说,那就早晨四颗,晚上三颗,猴子们一听就高兴起来。这个故事就是成语“朝三暮四”的由来。

  一个月前,我突发奇想。1963年我上高二时,适逢高教部、中国数学协会和北京市教育局联合举办《第一届北京市中学生数学竞赛》。其中有一道数学推理题“猴子分花生的故事”,我凭这道题获得了竞赛二等奖。这道题以及苏步青教授的总结报告“从猴子分花生谈起”,给我印象极其深刻,以致如今已经过了60多年了,我还记忆犹新。我何不把这道题,交给DeepSeek和ChatGPT,考一考这两个智囊?看看它们有什么高招?

        这次“北京市中学生数学竞赛”,凡北京市市属高中二,三年级的学生都可以报名参加。竞赛委员会由当代中国几位数学泰斗组成。华罗庚任组长,苏步青任副组长。为鼓励大家踊跃参赛,特奖励数学竞赛第一名可以保送北京大学数学系。
        这次数学竞赛的宗旨是以“培养和考察中学生分析问题,解决问题的能力”为主。考分不以单纯的答案对错为主,而是以分析步骤和推理过程步步评分。高二,高三不分组,统一试题。我当时是高二学生,我有幸参加了这次竞赛,并以第二名优秀奖的资格,参加了由华罗庚教授主持的数学竞赛总结及发奖大会。华罗庚教授亲自为第一名获奖者唐守文同学颁奖。(唐守文好像是北京第十三中学的高三学生,据说他平时的学习成绩并不突出,但酷爱参加各种辩论,才思敏捷,逻辑思维清晰,分析推理严谨。)现在看来,这次数学竞赛所代表的教育方向,正如美国现代教育,以培养具有创新才能的人才为目的。

 

3.  猴子分花生的故事

 

        总结大会上,苏步青教授作了总结报告“从猴子分花生谈起”。“猴子分花生”是数学竞赛其中一道试题,现简述如下,我想作家协会里一定也有不少理工出身的作家,有兴趣的话不妨一试,题目说:

        有N只猴子(N为任意正整数),围坐成一个圆圈,现在有N的任意整数倍的花生,随机分给这N只猴子。然后,所有的猴子同时将手中的花生作如下调整:每只猴子把手中花生数目的一半(如果该猴子手中花生当时为偶数)或者手中花生总数减一个的一半(如果该猴子手中花生当时为奇数)分给坐在它右边的猴子。试证明,经过有限次数的调整之后,所有猴子手中花生的数量,变得一样多。

        苏教授说,这道题满分为120分。如果谁用课堂上学到的的数学定理,例如数学归纳法,证明出了这道题,虽然答案不错,但他只能得到这道题目的一半不到的分数50分。

  如果谁在证明过程中用数学推理和分析方法说明以下几个推理,哪怕你根本还没有获得最终答案,你也可以凭部分分析结论,获得部分分数:

  推理一  如果你得到:经过每次调整,所有猴子手中花生加在一起总数不变。就可以得到20分。

  推理二  如果你进一步推理出:经过每次调整,当时手中花生数目最多的猴子,手中花生数目绝不可能再增加,同时,当时手中花生数目最少的猴子,手中花生数目也绝不可能再减少。加上推理一,就可以得到60分,

  推理三  如果你能再进一步推理出:经过每次调整,当时手中花生数目最多的猴子总数,至少减少一个,而当时手中花生数目最少的猴子总数,也至少减少一个,只要你得出这个分析结论,你就可以得到100分。虽然表面上看,你还没有完全证明出本题目,但你比用数学归纳法证明出本题的人的得分要高许多。

  推理四  你如果还能进一步证明这一结论(无论用什么方法),你将可以得到本题满分120分。

        苏教授说,千万别小看这个看似荒唐的题目。它蕴含着自然界的一个极重要的规律。物质世界千差万别,有高有低,有热有冷,有大有小,有浓厚有稀薄,但是自然界的引力和物质分子的运动,使物质世界总是不断地趋于相对平衡。例如水总是从高处往低处流,像U型管原理一样,高处的水面会降低,低处的水面会升高,最后达到一个自然界的相对平衡,相对稳定状态。随着自然环境的变化,平衡和稳定会被打破,又出现差异,于是进入一个新的调整阶段,趋于新的平衡。自然界除了水的例子之外,冷热空气的对流,高浓度物质向低浓度物质的扩散等等,都是同样的原理。

  同时,它也蕴含着中国几千年来“中庸之道”的哲学思想基础。大约在2500年前,孔子去鲁恒公庙观礼,看到了一个歪倾的瓦罐。孔子问守庙人,为什么不把瓦罐扶正?守庙人说:“这是‘佑座之器’——欹,没有水的时时候瓦罐呈歪斜状态。装上一半水就正过来了。装满了水,却反而又倾斜了。” 孔子听了顿开茅塞,大为感叹,悟出了“中庸之道”。

  无论你平时数学成绩多么顶尖,无论你数学头脑多么发达,如果你只是抱着传统的解一道数学题,对付一次纯粹数学考试的态度,参与这次数学竞赛,那么你能获奖的概率几乎为零。因为这里的题目,都是自然界里无数事物的普遍规律,抽象出一个个纯数学命题或数学模型,只有从宏观的自然现象和规律,来看待和分析这些具体的数学命题,你才有可能跳出传统的纯数学的分析方法和证明思路。

  苏教授的这一番分析和教诲,使我对数学的认识产生一次巨大的飞跃,“数学来自生活,又高于生活”。这次数学竞赛对我来说,可称得上是一次思想境界的脱胎换骨。

 

4.  与DeepSeek过招

 

  一个月前,我把数学竞赛中的“猴子分花生”的题目分别发给DeepSeek和ChatGPT,让他们给我解答。很快,他们就给了我答案和分析方法,两者都答的不错。于是我就要他们也给我出一道大致相同的数学推理题。很快DeepSeek就给我出了一道也是“猴子分花生”的题,问题是:

  有一堆花生,五只猴子先后来分。第一只猴子把花生分成五堆,发现多了一颗,于是它把多出的一颗扔掉,自己拿走了一堆。接着,第二只猴子把剩下的花生再次分成五堆,发现又多了一颗,于是它也把多出的一颗扔掉,自己拿走了一堆。第三、第四、第五只猴子都按照同样的方法分花生。问:最初至少有多少颗花生?

        我一看,这个题目似乎不难。马上就开始做起来。哪知搞了半天也没个结果,也不知是我年老思维衰退,还是20年前那场脑中风伤了我的大脑,使我记忆力和思维能力大不如前。解题的基本思路,我已经找到了,但是,翻来覆去,总是越绕越糊涂。两天后,还是没结果,我就把题目又同时发回给DeepSeek和ChatGPT,让他们解答。很快答案就回来了。DeepSeek用的是逐项排除法,分析过程写了整整三大片,答案是13281,但是我一验证,答案不对。我试图找出它究竟错在哪里,可是整整三大片,把我搞得头昏脑胀。DeepSeek的思路和分析方法是对的,可是推理太复杂,怎么也绕不出来。我就回答DeepSeek,告诉他答案不对,并且列给他验证过程。它回答承认计算过程有误,它又把三大页的分析过程从新发了一遍,但是还是没有给我正确的答案。几次反复,花了我好几天时间,还是毫无进展。我只好在网上浏览用户评论,终于发现,许多用户留言反映,DeepSeek对于人机会话类的问题,有他的突出优势,但是对于逻辑推理方面的问题,会时常出错。

  ChatGPT的回答中,用的是传统分列式,算式很长,大括弧套中括弧,中括弧又套小括弧,一会儿加1,一会儿减1,一会儿乘4,一会儿除5,而且代号繁杂,光前后寻找几十个变量符号就把我搞糊涂了。过程也是写了长达4页。答案是3121,经验证,这个答案是对的。可是光大致看了一下他的分析过程,就嫌太麻烦了。

  这个题目,比起我在数学竞赛中的“猴子分花生”的问题,只能算“小巫见大巫”。我就不信我做不出来。可是几乎一个月了,光草稿纸就用了几纸篓了,还是一筹莫展。难道我真的退化到比十几岁时都不如了吗?搅得我整夜整夜睡不着觉,一闭上眼睛,就只看到一群猴子,跳来跳去,一边剥花生,一边朝我发笑。搞得我整天茶饭不思,神魂颠倒,都有些精神恍惚了。

  前几天,太太怕我真的走火入魔了,就逼着我,一周不许想猴子。冷静了几天后,昨天从拾就业,脑子也清醒多了,也吸取了以前的错误教训,终于花了一整夜,按自己的思路,把这道“猴子分花生”的问题解决了。我是用的纯粹数学排除法,分析过程,也只写了一页纸,太太看了都一目了然,比两个智能机器都强多了。

  我终于战胜了猴子。把猴子们关进了笼子里。

  如果有谁还觉得不够过瘾,这里还有另一个关于“猴子分花生”的问题:

        把1600颗花生,完全分给100只猴子,不管怎样分,至少有4只猴子得到的花生一样多。

  我在这里也设一个有奖竞猜,如有人能把以上三道题都答出来,我将给于重奖。