Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Add Traditional Chinese Translation for README and Assignment 1 #179

Open
wants to merge 2 commits into
base: main
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
148 changes: 148 additions & 0 deletions lessons/1-Intro/translations/README.zh-HK.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,148 @@
# AI簡介

![漫畫總結人工智能](../sketchnotes/ai-intro.png)

> 插圖作者 [Tomomi Imura](https://twitter.com/girlie_mac)

## [課前測驗](https://red-field-0a6ddfd03.1.azurestaticapps.net/quiz/101)

**人工智能** 是一門令人興奮的學科,研究如何使使計算機表現智能行為,例如可以執行人類擅長的工作。

最初的電腦由[Charles Babbage](https://en.wikipedia.org/wiki/Charles_Babbage) 發明,用來執行算法—,即對數字進行定義明確的程序運算。即使現代電腦儘管比十九世紀的原始模型先進得多,但依然遵循著受控計算的思想。因此,如果我們知道達成目標所需的確切步驟序列,就有可能編程讓電腦去做某件事情。

![人像照片](images/dsh_age.png)

> 照片來自[Vickie Soshnikova](http://twitter.com/vickievalerie)

> ✅ 從一個人的照片中確定他/她的年齡是一項無法明確編程的任務,因為我們不知道估算年齡時,我們的腦袋是如何想出一個數字的。

---

然而,有些任務我們並不確切知道如何解決。例如通過照片確定一個人的年齡。我們不知不覺地掌握估算年齡的技能,因為我們見過許多不同年齡的人的例子,但我們不能明確地解釋如何做到這一點,也不能編程讓電腦去做。這正是**人工智能**(簡稱AI)感興趣的任務類型。

✅ 想一想電腦的人工智能可以幫你完成什麼任務?諸如金融、醫藥和藝術等領域將會如何通過AI獲益?

## 弱AI與強AI

解決特定的人類問題,例如從照片中確定一個人的年齡,屬於**弱AI**範疇。因為我們只是創建一個只能解決一項任務的系統,而不是像人類一樣,可以解決各種問題。當然,開發普遍智能的電腦系統從各個角度來說都十分有趣,對於學習意識哲學的學生來說亦是如此。這類AI被稱為**強AI**,或**[人工通用智能](https://en.wikipedia.org/wiki/Artificial_general_intelligence)** (AGI).

## 智能的定義與圖靈測試

**[智能](https://en.wikipedia.org/wiki/Intelligence)**一詞並沒有清晰的定義。人們可以說智能與**抽象思維**或者**自我意識**有關,但我們依然未能恰當地定義這個詞。

![一隻貓](images/photo-cat.jpg)

> [照片](https://unsplash.com/photos/75715CVEJhI)作者[Amber Kipp](https://unsplash.com/@sadmax)來自Unsplash

為了證明*智能*定義的模糊,請嘗試回答這個問題:“貓有智慧嗎?”。對於這個問題,不同的人往往會有不同的答案,因為沒有一個公認的測試去證明這論述。如果你認為貓有智能,那麼你可以試試讓貓咪通過智商測試……

✅ 想一想你會如何定義智力。一隻能夠走出迷宮獲得食物的烏鴉是有智力的嗎?一個孩子是聰明的嗎?

---

在討論人工通用智能時,我們需要一些方法證明我們真的創造了一個真正的智能係統。[阿蘭·圖靈](https://en.wikipedia.org/wiki/Alan_Turing) 提出了**[圖靈測試](https://en.wikipedia.org/wiki/Turing_test)**的方法,用來判斷一個系統是否智能。測試會將具有智慧的人類與該系統比較,由於自動化的對比有可能被電腦程序繞過,所以評估的過程由人類進行。在比較過程中,如果人類無法在基於文本的對話中區分真人和計算機系統,那麼該系統就被認為是智能的。

> 一個在聖彼得堡開發的名為[Eugene Goostman](https://en.wikipedia.org/wiki/Eugene_Goostman)的聊天機器人在2014年利用小聰明通過了圖靈測試:它事先說自己是一位來自烏克蘭的十三歲男孩,這為之後對話中知識和語言的欠缺找到了理由。五分鐘對話後,這款聊天機器人令30%的評委相信他是人類。圖靈曾經預測,在2000年就會出現通過圖靈測試的機器,但是我們應該明白,這個個聊天機器人並不代表我們已成功創造了智能系統,或者系統愚弄了人類,而是機器人的創造者愚弄了人類!

✅ 你有沒有被聊天機器人騙過,以為你在和人類對話?它是如何令你信服的?

## 實現AI的不同方法

如果我們想讓計算機的行為像人一樣,我們需要想辦法令電腦模擬我們的思維方式。因此,我們需要瞭解是什麼讓人類變得聰明。

> 為了能通過編程令電腦變智能,我們需要了解自己是如何做出決策的。如果你自我反省一下,就會發現有些過程是下意識發生的。比如,我們可以不假思索地分辨貓和狗,而其他的判斷可能會用到推理。

為了解這一問題,有兩種方法:

自上而下的方法 (符號推理) | 自下而上的方法 (神經網絡)
---------------------------------------|-------------------------------------
自上而下的方法是對一個人解決問題的方式進行建模。包括從人類身上獲取**知識**,之後用電腦可理解的方式表達出來。我們還需要讓電腦具備**推理**能力。 | 自下而上的方法模擬了人腦結構,有數量龐大的簡單單元組成,稱為**神經元**。每個神經元將接收的數據進行加權平均運算。我們可以向一個神經網絡提供**訓練數據**,以解決實際問題。

還有一些其他實現智能的方法:

* 複雜的智能行為可以通過大量簡單單元間的互動實現,**湧現**/**協同**或**多智能體系統**的設計便是基於此。根據[進化控制論](https://en.wikipedia.org/wiki/Global_brain#Evolutionary_cybernetics),智能可以通過相對簡單、應激性的行為中*反映*出來。這一過程被稱為*元系統躍遷*。

* **進化法**或**遺傳算法**是一個基於進化原理的優化過程。

我們會在課程後期討論這些方法,但目前我們暫時關注自上而下和自下而上這兩種方法。

### 自上而下的方法

在**自上而下的方法**中,我們想辦法對推理進行建模。因為我們在推理時思維可以逐步遞進,所以我們試著將此過程鑄成體系,在電腦中通過編程呈現相同的過程。這叫做**符號推理**。

人們的腦中往往有一些規則來指導他們的決策。例如當醫生診斷病人時,發燒可能代表這位病人身體有炎症,從而醫生會對症下藥。應用一大套規則去解決某一個具體問題時,醫生就會得出最終的診斷結果。

這種方法十分依賴**知識再現**和**推理**。從人類專家的腦中提取知識應該是最難的部分,因為一位醫生大多數情況下並不確切知道他/她是如何得出一個特定診斷的。某些情況下,結論不是通過明確的思考而得出的,比如通過照片估算一個人的年齡時,我們並不只是靠運用知識進行判斷的。

### 自下而上的方法

另一種方法是模擬我們大腦中最基礎的單位——神經元。我們可以在電腦中構建**人工神經網絡**,然後通過舉例來教它解決問題。這個過程類似於新生兒通過觀察來了解周遭環境。

✅ 對嬰兒的學習過程做一些研究。嬰兒大腦的基本要素是什麼?

> | 機器學習又是什麼? | |
> |--------------|-----------|
> | 人工智能中,電腦通過學習一些數據來解決問題的過程叫做**機器學習**。本課程將不討論經典的機器學習,欲知詳情可移步[機器學習入門](http://aka.ms/ml-beginners)課程。 | ![機器學習入門](images/ml-for-beginners.png) |

## AI簡史

人工智能領域開始於二十世紀中期。最初,符號推理方法盛行,也取得了不少成功實例。例如專家系統——它能夠在某些領域扮演專家的角色。但人們很快發現這種方法難以拓展。從人類專家那裡提取知識、在電腦中儲存並且令其再現其實是一個非常複雜的任務,而且成本高昂,並不實用。這導致了七十年代所謂的[AI寒冬](https://en.wikipedia.org/wiki/AI_winter)。

<img alt="Brief History of AI" src="images/history-of-ai.png" width="70%"/>

> 照片作者[Dmitry Soshnikov](http://soshnikov.com)

隨著時間的推移,計算成本降低、可用的數據變多,於是神經網絡的方法開始在許多領域展現出與人類媲美的強大力量,比如電腦視覺和語音理解範疇。過去十年,人工智能大多被用作神經網絡的同義詞,因為我們聽到的大多數人工智能都是基於神經網絡而成功的。

我們可以觀察算法的變遷,例如在創建國際象棋的電腦程序時:

* 早期國際象棋程序以搜索為基礎。程序估算對手下幾步棋的走法,之後根據在這幾種可能的走法中選擇步數最少的最佳棋步。這便是屬於搜索算法中的[剪枝算法](https://en.wikipedia.org/wiki/Alpha%E2%80%93beta_pruning)。
* 在對局的後期,搜索算法的效果很好,因為可能的落子位置不多。然而棋局開盤時的搜索空間巨大,算法可以通過學習人類棋手的比賽來改進。隨後的實驗採用了[案例式推理](https://en.wikipedia.org/wiki/Case-based_reasoning)算法,程序會在知識庫中搜索與當前棋局非常類似的案例。
* 可以打敗人類棋手的現代程序基於神經網絡和[強化學習](https://en.wikipedia.org/wiki/Reinforcement_learning),程序可以通過長時間與自己對弈,從自己的錯誤中學習——這和人類學習下棋是極其相似的。但是電腦程序可以在短時間內大量對局,學習的更快。

✅ 調查一下AI還玩過哪些遊戲。

同樣,我們也可以看到創造“交流程序”(可能通過圖靈測試)的方法轉變:

* 早期的[Eliza](https://en.wikipedia.org/wiki/ELIZA)程序基於非常簡單的語法規則,可以將輸入的句子重新表述為一個問題。
* 現代的語音助理如Cortana、Siri或者Google助手都採用了混合系統,使用神經網絡將語音轉換為文本,並識別我們的意圖,之後採用推理或特別的算法執行人類指令。
* 我們在未來可能會擁有一個完整的基於神經的模型,可以自行處理對話。最近的生成式預訓練模型(GPT)和[圖靈自然語言生成模型](https://turing.microsoft.com/)系列的神經網絡在這方面顯示出了巨大成功。

<img alt="the Turing test's evolution" src="images/turing-test-evol.png" width="70%"/>

> 圖片作者Dmitry Soshnikov,[照片](https://unsplash.com/photos/r8LmVbUKgns)作者[Marina Abrosimova](https://unsplash.com/@abrosimova_marina_foto),Unsplash

## 近期的AI研究

神經網絡的研究大爆發始於2010年左右,當時各種公共數據集開始能夠被人們獲取。龐大的圖像數據集[ImageNet](https://en.wikipedia.org/wiki/ImageNet)包含了大約1400萬張含有註釋的圖片,誕生了 which contains around 14 million annotated images, gave birth to the [ImageNet大規模視覺識別挑戰賽](https://image-net.org/challenges/LSVRC/).

![ILSVRC準確度](images/ilsvrc.gif)

> 圖片作者[Dmitry Soshnikov](http://soshnikov.com)

[卷積神經網絡](../4-ComputerVision/07-ConvNets/README.md)於2012年首次用於圖像分類功能,大大降低了分類誤差(誤差由近30%降低至16.4%)。2015年,微軟研究院的ResNet架構[達到了人類準確度水平](https://doi.org/10.1109/ICCV.2015.123).

從那時起,神經網絡在許多任務中表現出色:

---

年份 | 可達人類水平的任務
-----|--------
2015 | [圖像分類](https://doi.org/10.1109/ICCV.2015.123)
2016 | [對話語音識別](https://arxiv.org/abs/1610.05256)
2018 | [自動機器翻譯](https://arxiv.org/abs/1803.05567) (Chinese-to-English)
2020 | [生成圖片說明](https://arxiv.org/abs/2009.13682)

過去幾年裡,我們見證了大型語言模型諸如BERT和GPT-3的出色成績。這主要是因為有大量的文本數據可用來訓練模型,使模型理解自然語言的結構與意義,我們還可以預訓練語言模型,使其用於某些專門任務。我們稍後會學習更多[自然語言處理](../5-NLP/README.md)的內容。

## 🚀 小挑戰

先瀏覽一下互聯網,你認為AI的應用在哪裡最能發揮效能?地圖應用?語音轉文字應用?還是電腦遊戲?研究一下這些系統是如何建立的。

## [課後測驗](https://red-field-0a6ddfd03.1.azurestaticapps.net/quiz/201)

## 複習與自學

複習[本課](https://github.com/microsoft/ML-For-Beginners/tree/main/1-Introduction/2-history-of-ML)內容,回顧人工智能和機器學習的歷史。從本課頂部的漫畫選取一個話題並進行更深入的研究,了解該話題演變的文化背景。

**作業**: [聊聊遊戲](assignment.md)
3 changes: 3 additions & 0 deletions lessons/1-Intro/translations/assignment.zh-HK.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,3 @@
# 聊聊遊戲

電腦遊戲深受AI與機器學習影響,這個作業就是請你撰寫一篇短文,談一談受到AI影響的一款遊戲。這款遊戲應該有一定的歷史,在不同的電腦系統上運行過,例如國際象棋或圍棋,你也可以討論乒乓球或吃豆人遊戲。寫一篇短文討論這款遊戲的過去、現在和受人工智能影響的未來。
Loading