用資工的角度看為甚麼 Nvidia 就是未來 ? #2

用資工的角度看為甚麼 Nvidia 就是未來 ? #2

contributed by <Tim096>

何謂未來 ?

即使不是資工的大家都聽過了 AR , VR , MR 現在甚至現在有了 XR 這種東西,而這邊我想給大家看一個很酷的東西,這是一位觀眾現場用手機拍出來的東西,你到現場看到的東西早已經分不清楚甚麼是現實甚麼是虛擬了。
影片
說真的當時我第一次看到這部影片的時候,心裡滿滿的震撼想者這肯定就是未來了。

過於強大的 ML(Machine learning)

GAN(Generative adversarial network)

用資工的角度看為甚麼 Nvidia 就是未來 ? #2 1
2014 一個超新星的誕生 GAN,上面是關於 生成對抗網路 GAN(Generative adversarial network) 這一想法的論文數量的攀升情況。

GAN 概念

GAN 是 2014 年蒙特婁大學博士生 Ian Goodfellow 提出來的(真是好傢伙),主要概念很簡單,好比一個遊戲有兩個角色,一個是偽造者 (counterfeiter),他不斷製造假鈔,另一個角色是警察,不斷從偽造者那邊拿到假鈔,判斷是真或假,然後,偽造者就根據警察判斷結果的回饋,不斷改良,最後假鈔變成真假難辨,這就是 GAN 的概念。

GAN 為何重要 ? 對於 ML 有甚麼影響 ?

1. 不用再花大量人力標註資料了,直接利用GAN模型生成即可,『監督式學習』(Supervised)就變成『非監督式學習』(Unsupervised)。意味人力的需求被大量的減少
2. Deepfake把人臉進行變換,近年來最常被用來偽造名人性愛影片,被超多國家的監管的一個技術,讓普通人也可以輕鬆地偽造不存在的影片
3. 其他還有醫學、天文、…等應用,簡直無所不能(有點過頭了)。

用資工的角度看為甚麼 Nvidia 就是未來 ? #2 2

GAN 的一種模型,可以做到以下效果:
我們來看下面的圖,你能相信這些寢室圖都是 GAN 所製造出來的假圖嗎?我是看不太出來啦,GAN 真是可怕。

用資工的角度看為甚麼 Nvidia 就是未來 ? #2 3

GAN 小結

一個 AI 的 Data Set 可以自行產生,自行訓練,無論甚麼東西丟給他,他都可以幫你找到一個最好的解法去解決你的問題。
舉例 : AlphaGo 相信大家都知道吧,但是他的棋譜以及資料終究還是要有人去輸入,因此若是對戰沒有歷史資料的棋手其實他是很難贏的,但是後來就有人使用 GAN 開發出來全新的版本( MuZero )啦,他不需要知道他對戰的人了,甚至是棋譜他可以自行生成,自行訓練了。
資工現在研究這一領域的人,其實有一些人是很絕望的,做再多的研究似乎都沒有屁用,反正最後只有可能是使用 ML 才能夠超越 ML 了。
甚至更多更誇張的應用大家也可以試者上網找找以下切回正題 Nvidia

Nvidia + GAN 的機會

自動駕駛, AI , ML , XR ,機器人 等等,這幾個超級熱門的話題的共通點就是全部都需要大量的 GPU,而目前全球最大的 GPU 廠商就是 Nvidia ,而且 Nvidia 自己也有在努力研究這些領域,超多篇論文探討都有和 Nvidia 合作,每看一篇都會覺得自己的未來,真的很令人期待以及興奮,一家會讓人興奮的公司真的不多呢。

想像一個美好的未來一早起床用者 AI 語音助理提醒者今天一整天的規劃,以及冰箱裏面缺少甚麼,叫 AI 去幫您購買,並且用者機器人弄好早餐的一切,用者自動駕駛去上班,上班的時候偷用購物網站 ML 所推薦給你的商品,回到家用 XR 玩身歷其境的遊戲 或是 參加一個演唱會。

這美好的想像在 GAN 的想法出現以前,理想是很豐滿,但現實卻是很骨感的。其實有很多的難處的,舉例來說,這麼多的訓練資料,其實是很難去蒐集的。即使今天有了這麼多的訓練資料,也都要人工的標註的話。現實面來說,其實是有點不切實際的。GAN 由此而生,GAN 大大的解決了,上面兩個 ML 所遇到的難題,而且結果也相當不錯。

以上美好的想像一切都是基於 GPU 現在全力發展,當然 Nvidia 也不是沒有危機的,雖然 Nvidia 還是全球最大的 GPU 廠商,但是 AMD 最近追趕的趨勢真的不能小看,當然不管是哪一家廠商我認為未來都會很不錯發展,特別是 AMD 不管是在 CPU or GPU 都急速的追趕前面的廠商,AMD 其實我也想說的很多,下次希望有機會再來詳細談談 AMD 吧。

Data Center (Mellanox)

在今年(2020) 10 月的時候 Nvidia 做了一個史上最大的併購案(Nvidia 併購中最大),不畏市場逆風,狠砸 69 億美元,從 Intel 手中搶下以色列半導體公司 Mellanox Technologies ,鎖定企業資料科學應用產品。在這個資訊爆炸的年代,並且所有企業都想急於數位化,但這些資料又要如何儲存 ? 儲存在哪裡呢 ? Data Center 是一個 Nvidia 最近財報中急速成長的一塊 2016 年起,Nvidia 的數據中心營收成長迅速,其營收占比從 2016 年度的 11% 速增加到 2019 年度的 30% 左右,在個人或是單買顯卡的的成長趨緩,甚至是歐洲那邊已經出現了下滑,下一個成長的動能會是 Data Center,大家可能無法想像現在網路上的資訊爆炸,到底有多爆炸,以下是數據

1. Youtube 每分鐘被上傳300小時影片,注意單位是分鐘
2. 一天內網際網路產生的流量信息可以裝滿1億6800萬張光碟
3. 200萬篇文章在網上發布,相當於美國《時代》刊發770年的總量
4. Facebook 的系統一天要處理 25 億件的訊息和 500TB 以上的數據
5. 每天有1億8700萬小時的音樂被播放
6. 2019 年全球每天收發 2936 億封電子郵件
7. 一輛自動駕駛汽車每天將產生 4TB 的數據
8. LINE的使用大數據

還有很多沒有提到的,大家就可以知道為何 Data Center,Nvidia 這麼認真的發展了吧。


大家有沒有想過這邊到底需要多少能源阿 ? 這一塊有機會想深度了解一下XDDD 一直給自己挖坑,哈哈哈
還有一件事情,其實 Nvidia 收購 Mellanox 也有遭受到反托拉斯法的阻撓。

回到 Nvidia 所收購的那家公司 Mellanox Technologies,Mellanox 握有重要的伺服器互聯技術 InfiniBand。如果我們把伺服器當成一個小小盒子,Nvidia 研發的 NVLINK 與 NVSwitch 就是盒子內的互聯技術,而 InfiniBand 則是盒子之間的互連。 Nvidia 有了這些互聯技術,在推動資料中心規模化將更有效率。不僅止用在高速電腦 (HPC) 上,也適用在資料科學等企業領域。

目前想到關於技術領域的就這麼多,謝謝大家的觀賞。

Gooaye AI 推薦閱讀機器學習中: