Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Added Simplified Chinese translation for Lesson 1 #216

Open
wants to merge 1 commit into
base: main
Choose a base branch
from
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
148 changes: 148 additions & 0 deletions lessons/1-Intro/translations/README.zh-CN.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,148 @@
# AI简介

![一图总结人工智能](../../sketchnotes/ai-intro.png)

> 插图作者 [Tomomi Imura](https://twitter.com/girlie_mac)

## [课前测验](https://red-field-0a6ddfd03.1.azurestaticapps.net/quiz/101)

**人工智能** 是一门令人兴奋的学科,研究如何使使计算机表现智能行为,例如可以执行人类擅长的工作。

起初,电脑由[Charles Babbage](https://en.wikipedia.org/wiki/Charles_Babbage) 发明,用于执行算法,即:对数字进行定义明确的程序运算。即使现代电脑尽管比十九世纪的原始模型先进得多,但依然遵循着受控计算的思想。因此,如果我们知道达成目标所需的确切步骤序列,就有可能编程让电脑去做某件事情。

![人像照片](../images/dsh_age.png)

> 照片来自[Vickie Soshnikova](http://twitter.com/vickievalerie)

> ✅ 从一个人的照片中确定他/她的年龄是一项无法明确编程的任务,因为我们不知道估算年龄时,我们的脑袋是如何想出一个数字的。

----

然而,有些任务我们并不确切地知道如何解决。例如,通过照片确定一个人的年龄。我们不知不觉地掌握估算年龄的技能,因为我们见过许多不同年龄的人的例子,但我们不能明确地解释如何做到这一点,也不能编程让电脑去做。这正是**人工智能**(简称AI)感兴趣的任务类型。

✅ 想一想电脑的人工智能可以帮你完成什么任务?诸如金融、医药和艺术等领域将会如何通过AI获益?

## 狭义AI与广义AI

解决特定的人类问题,例如从照片中确定一个人的年龄,属于**狭义AI**范畴。因为我们只是创建一个只能解决一项任务的系统,而不是像人类一样,可以解决各种问题。当然,开发普遍智能的电脑系统从各个角度来说都十分有趣,对于学习意识哲学的学生来说亦是如此。这类AI被称为**广义AI**,或[人工通用智能](https://en.wikipedia.org/wiki/Artificial_general_intelligence)(AGI).

## 智能的定义与图灵测试

**[智能](https://en.wikipedia.org/wiki/Intelligence)**一词并没有清晰的定义。人们可以说智能与**抽象思维**或者**自我意识**有关,但我们依然没有恰当地定义这个词。

![一只猫](../images/photo-cat.jpg)

> [照片](https://unsplash.com/photos/75715CVEJhI)作者[Amber Kipp](https://unsplash.com/@sadmax)来自Unsplash

为了证明*智能*定义的模糊,请尝试回答这个问题:“猫有智慧吗?”。针对这个问题,不同的人往往会有不同的答案,因为没有一个公认的测试去验证这个说法的对错。如果你认为猫有智能,那么你可以试试让猫咪通过智商测试……

✅ 想一想你会如何定义智力。会解密来获得食物的乌鸦算聪明吗?小孩子算聪明吗?

----

当讨论人工通用智能时,我们需要一种方法证明我们真的创造了一个真正的智能系统。 [阿兰·图灵](https://en.wikipedia.org/wiki/Alan_Turing) 提出了**[图灵测试](https://en.wikipedia.org/wiki/Turing_test)**的方法,用来判断一个系统是否智能。该测试将一个给定的系统与本质上具有智能的东西——一个真正的人类进行比较,由于自动化的对比有可能被电脑程序绕过,所以评估的过程由人类进行。在比较过程中,如果人类无法在基于文本的对话中区分真人和计算机系统,那么该系统就被认为是智能的。

> 一个在圣彼得堡开发的名为[Eugene Goostman](https://en.wikipedia.org/wiki/Eugene_Goostman)的聊天机器人在2014年利用小聪明通过了图灵测试:它事先说自己是一位来自乌克兰的十三岁男孩,这为之后对话中知识和语言的欠缺找到了理由。五分钟对话后,这款聊天机器人令30%的评委相信他是人类。图灵曾经预测,在2000年就会出现通过图灵测试的机器,但是我们应该明白,这个个聊天机器人并不代表我们已成功创造了智能系统,或者系统愚弄了人类,而是机器人的创造者愚弄了人类!

✅ 你有没有被聊天机器人骗过,以为你在和人类对话?它是如何令你信服的?

## 实现AI的不同方法

如果我们想让计算机的行为像人一样,我们需要想办法令电脑模拟我们的思维方式。因此,我们需要了解是什么让人类变得聪明。

> 为了能通过编程使电脑变智能,我们需要了解自己是如何做出决策的。如果你自我反省一下,就会发现有些过程是下意识发生的——比如,我们可以不假思索地分辨猫和狗——而其他的一些过程则涉及到推理。

为了解这一问题,有两种方法:

自上而下的方法 (符号推理) | 自下而上的方法 (神经网络)
---------------------------------------|-------------------------------------
自上而下的方法是对一个人解决问题的方式进行建模。包括从人类身上获取**知识**,之后用电脑可理解的方式表达出来。我们还需要让电脑具备**推理**能力。 | 自下而上的方法模拟了人脑结构,有数量庞大的简单单元组成,称为**神经元**。每个神经元将接收的数据进行加权平均运算。我们可以向一个神经网络提供**训练数据**,以解决实际问题。

还有一些其他实现智能的方法:

* 一种**新兴**、**协同**或**多智能体方法**是基于这样一个事实:通过大量简单智能体的互动,可以获得复杂的智能行为。根据[进化控制论](https://en.wikipedia.org/wiki/Global_brain#Evolutionary_cybernetics),智能可以通过相对简单、应激性的行为中*反映*出来。这一过程被称为*元系统跃迁*。

* **进化法**或**遗传算法**是一个基于进化原理的优化过程。

我们会在课程后期讨论这些方法,但目前我们暂时关注自上而下和自下而上这两种方法。

### 自上而下的方法

在**自上而下的方法**中,我们尝试对推理进行建模。因为我们在推理时思维可以逐步递进,所以我们试着将此过程铸成体系,在电脑中通过编程呈现相同的过程。这叫做**符号推理**。

人脑中往往有一些规则来指导他们的决策。例如当医生诊断病人时,发烧可能代表这位病人身体有炎症,从而医生会对症下药。应用一大套规则去解决某一个具体问题时,医生就会得出最终的诊断结果。

这种方法十分依赖**知识再现**和**推理**。从人类专家的脑中提取知识应该是最难的部分,因为一位医生大多数情况下并不确切知道他/她是如何得出一个特定诊断的。某些情况下,结论不是通过明确的思考而得出的,比如通过照片估算一个人的年龄时,我们并不只是靠运用知识进行判断的。

### 自下而上的方法

另一种方法是模拟我们大脑中最基础的单位——神经元。我们可以在电脑中构建**人工神经网络**,然后试图通过给它一些例子来教它解决问题。这个过程类似于新生儿通过观察来了解周遭环境。

✅ 对婴儿的学习过程做一些研究。婴儿大脑的基本要素是什么?

> | 机器学习又是什么? | |
> |--------------|-----------|
> | 人工智能中,电脑通过学习一些数据来解决问题的过程叫做**机器学习**。本课程将不讨论经典的机器学习,欲知详情可移步[机器学习入门](http://aka.ms/ml-beginners)课程。 | ![机器学习入门](../images/ml-for-beginners.png) |

## AI简史

人工智能领域开始于二十世纪中期。最初,符号推理方法盛行,也取得了不少成功实例。例如专家系统——它能够在某些领域扮演专家的角色。但人们很快发现这种方法难以拓展。从人类专家那里提取知识、在电脑中储存并且令其再现其实是一个非常复杂的任务,而且成本高昂,并不实用。这导致了七十年代所谓的[AI寒冬](https://en.wikipedia.org/wiki/AI_winter)。

<img alt="Brief History of AI" src="../images/history-of-ai.png" width="70%"/>

> 照片作者[Dmitry Soshnikov](http://soshnikov.com)

随着时间的推移,计算成本降低、可用的数据变多,于是神经网络的方法开始在许多领域展现出与人类媲美的强大力量,比如计算机视觉和语音理解范畴。过去十年,人工智能大多被用作神经网络的同义词,因为我们听到的大多数人工智能成功都是基于神经网络的。

我们可以观察到在创建象棋计算机程序方面的方法发生了变化:

* 早期国际象棋程序以搜索为基础。程序估算对手下几步棋的走法,之后根据在这几种可能的走法中选择步数最少的最佳棋步。这便是属于搜索算法中的[剪枝算法](https://en.wikipedia.org/wiki/Alpha%E2%80%93beta_pruning)。
* 在对局的后期,搜索算法的效果很好,因为可能的落子位置不多。然而棋局开盘时的搜索空间巨大,算法可以通过学习人类棋手的比赛来改进。随后的实验采用了[案例式推理](https://en.wikipedia.org/wiki/Case-based_reasoning)算法,程序会在知识库中搜索与当前棋局非常类似的案例。
* 可以打败人类棋手的现代程序基于神经网络和[强化学习](https://en.wikipedia.org/wiki/Reinforcement_learning),程序可以通过长时间与自己对弈,从自己的错误中学习——这和人类学习下棋是极其相似的。但是电脑程序可以在短时间内大量对局,学习的更快。

✅ 调查一下AI还玩过哪些游戏。

同样,我们也可以看到创造“可对话程序”(可能通过图灵测试)的方法转变:

* 早期的[Eliza](https://en.wikipedia.org/wiki/ELIZA)程序基于非常简单的语法规则,可以将输入的句子重新表述为一个问题。
* 现代的语音助理如Cortana、Siri或者Google助手都是混合系统。它们使用神经网络将语音转换为文本,并识别我们的意图,之后采用推理或显式的算法执行所需操作。
* 在未来,我们期望一种完全基于神经网络模型来处理对话。最近的生成式预训练模型(GPT)和[图灵自然语言生成模型](https://turing.microsoft.com/)系列的神经网络在这方面取得了巨大成功。

<img alt="the Turing test's evolution" src="../images/turing-test-evol.png" width="70%"/>

> 图片作者Dmitry Soshnikov,[照片](https://unsplash.com/photos/r8LmVbUKgns)作者[Marina Abrosimova](https://unsplash.com/@abrosimova_marina_foto),Unsplash

## 近期的AI研究

神经网络的研究大爆发始于2010年左右,各种公共数据集开始变得可用。一个包含了大约1400万张含有注释图片的庞大数据集[ImageNet](https://en.wikipedia.org/wiki/ImageNet),诞生了[ImageNet大规模视觉识别挑战赛](https://image-net.org/challenges/LSVRC/).

![ILSVRC准确度](../images/ilsvrc.gif)

> 图片作者[Dmitry Soshnikov](http://soshnikov.com)

[卷积神经网络](../4-ComputerVision/07-ConvNets/README.md)于2012年首次用于图像分类功能,大大降低了分类误差(误差由近30%降低至16.4%)。 2015年,微软研究院的ResNet架构[达到了人类准确度水平](https://doi.org/10.1109/ICCV.2015.123).

从那时起,神经网络在许多任务中表现出色:

----

年份 | 可达人类水平的应用领域
-----|--------
2015 | [图像分类](https://doi.org/10.1109/ICCV.2015.123)
2016 | [对话语音识别](https://arxiv.org/abs/1610.05256)
2018 | [自动机器翻译](https://arxiv.org/abs/1803.05567) (Chinese-to-English)
2020 | [生成图片说明](https://arxiv.org/abs/2009.13682)

过去几年里,我们见证了大型语言模型诸如BERT和GPT-3的出色成绩。这主要是因为有大量的文本数据可用来训练模型,使模型理解文本的结构与意义。我们还可以预训练语言模型,使其用于某些专门任务。我们稍后会学习更多[自然语言处理](../5-NLP/README.md)的内容。

## 🚀 小挑战

浏览一下互联网,找出你认为AI最能发挥效能的领域?地图应用?语音转文字应用?还是电脑游戏?研究一下这些系统是如何建立的。

## [课后测验](https://red-field-0a6ddfd03.1.azurestaticapps.net/quiz/201)

## 复习与自学

可以通过学习[课程](https://github.com/microsoft/ML-For-Beginners/tree/main/1-Introduction/2-history-of-ML)回顾人工智能和机器学习的历史。从本课顶部的漫画选取一个话题并进行更深入的研究,了解该话题演变的文化背景。

**作业**: [聊聊游戏](assignment.md)