一九七六年,兰德尔·戴维斯(Randall Davis)在斯坦福大学获得人工智能博士学位,并发表了文章《Applications of Meta Level Knowledge to the struaintenand Use of Large Knowledge Bases》。该文提出,采用集成的面向对象模型可以有效提高知识库(KB)开发、维护和使用的完整性。共享对象增强了模型之间的跟踪能力,促进了半自动开发和维护功能的实现。而抽象模型则是在知识库构建过程中创建的,推理是在模型初始化阶段执行的。兰德尔·戴维斯在基于知识的系统和人机交互领域做出了开创性的贡献,发表了约100篇学术文章,并在多个系统的开发中发挥了核心作用。他与研究小组共同开发了能够理解用户图像、手势和语言的先进工具,促进了与计算机之间自然的多模式交互。
计算机视觉任务包括获取、处理、分析和理解数字图像的方法,以及从现实世界中提取高维数据以生成数字或符号信息(例如用于决策)。在这个背景下,理解意味着将视觉图像(类似于人类视网膜的输入)转换为具有思维意义并能够引发适当行动的世界描述。这种图像理解可以视为利用几何、物理、统计学和学习理论构建的模型,从图像数据中提取符号信息。计算机视觉作为一个科学学科,涉及支撑人工系统从图像中提取信息的理论。图像数据可以呈现多种形式,例如视频序列、来自多个摄像头的视图、3D扫描仪生成的多维数据,以及来自LiDAR传感器或医疗扫描设备的3D点云。计算机视觉技术的研究旨在将这些理论和模型应用于计算机视觉系统的构建。在一九六零年的时候,计算机视觉作为一个重要的人工智能研究分支,在各大研究院校中受到追捧。 计算机视觉的主要目标是模仿人类的视觉系统,成为为机器人增加智能行为的基础。在一九六六年的时候,研究人员相信通过一个连接到计算机的摄像头就能够石像让计算机描述所检测到的图片内容。二十世纪七十年代的研究为现代许多计算机视觉算法奠定了早期基础。这些研究涉及从图像中提取边缘、标记线条、非多面体和多面体建模,将物体表示为较小结构的互连,以及光流和运动估计等关键技术。这些方法为后来的计算机视觉发展提供了重要的理论和实践支持。
朱迪亚·珀尔(Judea Pearl)是一位以色列裔美国计算机科学家和哲学家,以倡导人工智能中的概率方法和发展贝叶斯网络而闻名。他还因提出基于结构模型的因果推理和反事实推理理论而备受赞誉。在二零一一年,计算机械协会授予他图灵奖,表彰他“通过发展概率和因果推理微积分对人工智能做出的根本性贡献”。贝叶斯网络(Bayesiawork),也称为信念网络(Belief work)或有向无环图模型(Directed Acyclic Graphical Model),是一种概率图模型,于1985年由朱迪亚·珀尔首次提出。它是一种处理人类推理过程中因果关系不确定性的模型,其网络拓扑结构是一个有向无环图(DAG)。贝叶斯网络的有向无环图中的节点表示随机变量{X?, X?,..., X?},这些变量可以是可观察的、隐变量或未知参数等。若两个节点之间存在因果关系或非条件独立性,则用箭头将它们连接起来。若两个节点之间以单箭头连接,表示其中一个节点是父节点(parent node),另一个是子节点(child node),这两个节点之间会形成一个条件概率值。简而言之,将某个研究系统中涉及的随机变量根据条件独立性绘制成一个有向图,就形成了贝叶斯网络。该网络主要用于描述随机变量之间的条件依赖关系,其中用圈表示随机变量,用箭头表示条件依赖。此外,对于任意的随机变量,其联合概率可以通过各自的局部条件概率分布相乘而得出,公式为:P(X1,...,Xk)=P(Xk∣X1,...,Xk?1)?P(X2∣X1)P(X1)P(X?,..., X?)= P(X?| X?,..., X???)\\cdots P(X?| X?) P(X?)P(X1,...,Xk)=P(Xk∣X1,...,Xk?1)?P(X2∣X1)P(X1)
二十世纪九十年代,人工智能领域迎来了两个重要的发展。一方面,蒂姆·伯纳斯·李(Tim Berners-Lee)在一九九八年提出了语义网,这是一种以语义为基础的知识网络或知识表示方法。随后,出现了OWL(Web Ontology Language)语言和其他相关的知识描述语言,为知识库的两个核心问题——知识表达和开放知识实体,提供了可能的解决方案。尽管这一思路在早期并未获得广泛认可,但二零一二年谷歌提出知识图谱的概念后,这一方向得到了明确的发展。另一方面,统计机器学习理论也取得了显著进展,包括瓦普尼克·弗拉基米尔(Vapnik Vladimir)等人提出的支持向量机、约翰·拉弗蒂(John Lafferty)等人的条件随机场,以及大卫·布莱(David Blei)和迈克尔·乔丹(Michael Jordan)等人的话题模型(LDA)。总体而言,这一时期的主旋律是人工智能的平稳发展,各个相关领域都取得了显著进步。
第三次人工智能浪潮的兴起标志可能要追溯到二零零六年,杰弗里·辛顿(Geoffrey Hinton)等人提出的深度学习技术,标志着这一浪潮的号角被吹响。与之前的浪潮不同,这一次引领潮流的是企业。塞巴斯蒂安·特龙(Sebastian Thrun)在谷歌领导了自动驾驶汽车项目;IBM的沃森(Watson)在二零一一年在《危险边缘》(Jeopardy)中战胜人类,夺得冠军;苹果在二零一一年推出了自然语言问答工具Siri;而二零一六年,谷歌旗下的DeepMind公司推出的阿尔法围棋(AlphaGo)则战胜了围棋世界冠军李世石。可以说,这一波人工智能浪潮的影响是前所未有的。之后,各种新型神经网络和学习层出不穷,如卷积神经网络,残差神经网络,生成对抗网络扽等。
如今,人工智能的应用无处不在,从人脸识别、车牌识别,到语音识别、对话系统和图片生成等,各行各业都受到了人工智能工具的深刻影响。这种广泛的应用引发了一个重要问题:人类是否已经准备好迎接下一个人工智能时代的到来?
在AIGC(人工智能生成内容)时代的浪潮中,我们面临着真假信息难以辨别的挑战。如果下一代盲目相信人工智能生成的内容,无论其正确与否,这是否是我们所期望的局面?这不仅关系到信息的真实性,还涉及到人类的判断力和批判性思维能力的培养。面对人工智能的迅速发展,我们需要认真思考如何教育和引导未来的世代,使他们能够在这个复杂的信息环境中保持清醒的头脑。