Take a Byte | 科技咬一口

感謝您的收聽！想要獲得更多更新和內容，請關注我們的社交媒體頻道：
☕ 訂閱 TaB+ 加入我們的專屬Line群 | https://www.buzzsprout.com/2307755/support
🔗 關注我們的社交媒體頻道 | https://takeabyte.buzzsprout.com

👋 大家好，歡迎收聽《Take a Byte | 科技咬一口》！在這個節目中，我們用輕鬆聊天的方式討論 IT、網通技術以及產業大小事。

🎙️ 每一集，我們將與業界專家進行訪談，分享最新的科技趨勢和實用的技術知識。無論你是業界專業人士還是對科技充滿好奇心的聽眾，這裡都有適合你的內容。

🌐 我們將帶給你有趣的故事、網通世界的新奇事物，以及深入淺出的技術解說。
Take a Byte 不僅僅是一個節目，更是一趟通往數位世界的奇妙之旅。

🚀 準備好與我們一同探索科技的未來了嗎？記得訂閱我們的節目，每個月都有新的內容等著你發現。Take a Byte，讓我們開始這場數位之旅吧！🌟

All Episodes

Take a Byte | 科技咬一口

EP4 | AI 背後的巫術大解密 Feat. Vito

June 07, 2024 • Take a Byte • Season 1 • Episode 4

這集內容超精彩，包羅萬象，你想了解的所有 AI 問題都在這集，延續 EP3 我們邀請到 AI專家 Vito 幫我們揭開關於 AI 的神秘面紗💡

本集主題
• AI 的三大面向組成
• 生成式 AI 的概念是甚麼，和 ML 機器學習、Deep Learning 深度學習有關係嗎?
• 很常聽到的AI 需要很多算力，算力到底是甚麼意思?
• 為甚麼算力不足、負載不足，會導致 AI 產出結果失敗?
• 如果 Vito 可以改變 AI 伺服器的話，會想改變哪一個部份呢?
• 一顆 GPU 要價多少? 為甚麼 OpenAI 想自己蓋晶圓廠? 很常聽到 AI 新創要各種籌錢?
🚀 記得訂閱我們的節目，每個月都有新的內容等著你發現。Take a Byte，讓我們開始這場數位之旅吧！🌟

歡迎留言跟我們分享你的想法以及心得回饋歐~

與我們聯絡～！

Support the show

感謝您的收聽！想要獲得更多更新和內容，請關注我們的社交媒體頻道：
☕ 訂閱 TaB+ 加入我們的專屬Line群 | https://www.buzzsprout.com/2307755/support
🔗 關注我們的社交媒體頻道 | https://takeabyte.buzzsprout.com

0:01

Hello大家好歡迎收聽Take a Byte科技咬一口這次節目中我們會用輕鬆聊天的方式討論IT 網通技術以及產業大小事 You can also catch our content on Youtube with subtitles, link will be in the descriptions below 這是AI內容的第二集如果還沒收聽第一集的朋友們可以先按下暫停聽完後再回來 Johnny喜歡用ChatGPT 那你有沒有試過同樣一個問題在不同的AI模組上去問的時候得到的答案會一樣嗎？還有學會不一樣而且會有時候會就是因為有些東西我們可能比這些AI的所謂的我把它稱之為可能是聊天機器人我可能比他更瞭解那個東西他答出來的答案你就知道他在亂講有時候真的會這樣有沒有例子我有例子像比如說那個時候我們就用個微軟那個Bing不是很有內建就是像ChatGPT那樣的我就會問他說請問美國職棒史上打最多安打的人是誰？他講出鈴木一郎沒有錯但是安打的數量跟他的時間是完全錯的 OK 對就是會這樣那我剛才有個問題是想問就是說 Vito哥有講到一件事情就是說準確率這件事那我們常常聽到算力算力這個名詞那算力越好是不是我們可以把它想象成當算力越好越強的公司它算出來的這個結果會準確可以像理解嗎？不見得耶其實以AI來說它有三大部分組成硬體部分就是你所謂的算力它也需要有一個數學公式也就是演算法幫你完成這件事情當然最重要它還是要有資料及大量的資料去幫助它這個演算法算出來資料越來越準確這三個因素缺一不可就像我們讀書一樣你的腦袋就是你的算力但是你的理解方式就是可能就是你的演算法方式你的數學那是我們在算數學的時候你的database 之前曾經看過多少那就是你的參數你可以用多少進來過所以其實每家做法都不太一樣難怪我數學那麼差應該是演算法這方面弄應該老師的問題不要不要怪老師要怪自己剛剛講到那個 Generative AI 生成式AI 它是怎麼樣的一個概念？生成式AI是什麼樣的概念？跟機器學習有關係嗎？有生成式AI 其實是從機器學習延伸下來一個叫深度學習它是屬於在深度學習裡面領域的東西喔！那它的資料分析量跟它的處理方式就跟我們認知的機器學習又有點不太一樣但它所用的算力跟它的所所謂的資料量會更大所以我會想AI是一個最大外圈叫做AI 然後中間有一塊領域叫機器學習然後再裡面有深度學習是沒錯還有更深嗎？目前沒有深度學習主要用的演算法大部分是我們神經內的演算法就跟我們腦袋裡面神經元一樣一個觸動也就是說一個資料產生一個新的接近於原本的資料然後一直持續的產生最後變成一個全新的資料原來如此一聽到神經元這個完全腦袋算力不夠這對我們算力不夠因為講算力然後剛才有講到AI 它是一個吃的怪獸那它算力這個名詞有一些抽象的那可能要用怎麼樣的方式能夠讓觀眾更加理解算力是什麼雖然剛剛Vito哥有講到算力就像腦但是我還是無法理解我的腦跟你的腦差別是什麼所以我們的算力不一樣嗎嗯計算機也就是我們電腦來說它的算力其實我們腦袋算一加一這種簡單的數學應該是非常快速對吧？對那但是以電腦來說它算一加一大概需要5到7個位元五到七個步驟去算它我們通常算這個就叫算力我們可能覺得一加一等於二這件事情是一個理所當然很快就可以算出來但電腦需要經過這麼多步驟纔能算出來它想要的結果這些步驟我就稱為算力那電腦的算力通常就是有單位來說好了它就是現在流行有兩個一個是TOPS 那一個是FLOPS 這兩個其實對我來說都差不多一個是是整數一個是有小數點的算力的單位？單位對我現在腦袋在算力已經有點不足了現在再講什麼這個比較偏向計算機概論太複雜那算力中間你說7個位元中間如果有斷的話是不是就有點像我們問ChatGPT 有的時候會導致它突然就跳錯誤出來對但是當你的算力不足的時候或者你負載過重的時候它就會開始沒辦法控制那它它是怎麼樣？為什麼會這樣總是被背後的那些機器它過熱嗎？還是超載了太多使用？這個我想問題應該蠻多因素的第一個可能當時的負載可能是過大的它沒辦法一次承受這麼多人同事間的詢問它就像你們剛剛說的我們可能問它一個簡單的問題它需要用到多少算力？那萬一同時間有1萬20萬100萬人進來的時候他的算力是不是可以負荷？這是一個問題那第二個我們當時的網路品質它是不是有辦法直接接收到這些訊息我覺得也是一個問題那我想想看還沒有其他的因素節能跟耗電有沒有關係？其實資料中心它們大部分裡面現在用的這些的像ChatGPT都是放在資料中心內他們有專門自己的供電系統那就我來看比較容易發生的問題應該是你的算力算力資源不足或者是算力資源不足就可能衍生出很多問題啊那大部分都是硬體上的配置的問題第二個就是網路延遲嗯對硬體上面啊你剛剛有問題要問所以我就說就是有點像是說有的感覺就像說我們人比如說我們算1加1等於2很快的但今天如果我跟你說 999減300 我們可能要經過很多步驟這感覺是很像算力就是比如說你問的越複雜他需要算力要越多的過程步驟越長的感覺是的沒錯但是現在的電腦因為它的算力都已經像以TOPS來說的話就可以執行得1000萬以上步驟了所以對它來講它是小case 我剛剛講那個才五個七個對但它一秒可以執行千萬所以這時候我們的算力跟電腦要比落差很大真的要跟他們共存了最明顯的譬如說電腦來算Pi 3.1415.... 那個對吧？我們人去算算了 100年幾百年現在好像小數點一下五十九幾位 200多位它一下瞬間就可以算到千位去過超厲害因為Vito哥我知道就是你跟他講說是負責就是公司研發 AI伺服器的部分了因為現在已經有很多AI伺服器在產業上面如果要讓你改變它的一些設計你會你會做出什麼樣的改變？ AI伺服器其實我個人認為有幾個面向可以去試著改變第一個我們要提到節能因為現在AI伺服器太耗電了上一集我們要講它非常耗電現在需要用很多比較新的一些冷卻技術像是液冷技術或浸沒式冷卻去讓它的效率這散熱的效率比較高一點不然它過熱就只能電腦就燒掉就燒不要這停擺我們剛剛其實有提到ChatGPT 它大概結合了15 000臺的我認知中的那個比較大型的AI伺服器那個AI伺服器裡面會有八個GPU也就是說它會一次要同時兼跑十二萬個一個GPU多少錢現在27000美金一顆27000美金所以為什麼OpenAI需要大量資金而且Sam Altman大家要自己蓋的晶圓廠這是一個好生意難怪大家都要做所以我剛剛提到第一個能源效率上的改善因為其實你把越多的能源用在運算上而不是花費能源在冷卻啊其他的地方上那你的算力整個就可以提升更高因為能源是固定的我們的現在目前可以產生的能源一座核電廠可以產生能源固定的其中20%或者30% 雖然可能10% 我不知道到底多少你用在冷卻上假如我有更好的方法讓能源效率提升的話我就可以把這些能源全部用在算力上所以我的算力就可以提升了 OK 嗯那還有嗎？還有別的你覺得特別想過改變的第二個其實現在的我們剛剛提到LLM和LAM 其實這些都需要大量的所謂資料參考的資料那以ChatGPT 來說它需要1750億個參數吧 1750億的這個概念什麼？你光數字我就不知道你要數多久它花了快2年時間去跑是1750億的參數的資料產生了ChatGPT 這個軟體出來那以我來說這麼大的資料量可能GPU自己處理因為我剛剛有說它的資料處理是有一個步驟的當的原始資料進來的時候產生一個接近原始資料的新資料一步一步一步一直去產生然後最後產生出你預期的它預期的要產生的資料那這些過程裡面會有大量的資料在不同的GPU之間傳輸那資料傳輸是我們的最大的以我硬體角度來看是最大的瓶頸也就是說這有點牽扯到計算機概論的領域啊我們現在的資料傳輸必須得透過CPU 它只能PCIE一條通道去做資料傳輸可能要簡單一點好大家腦袋的算力已經不夠了用大小水管來講我又在發呆了過熱力過熱了我們可能資料在不同的之間傳輸的時候就有點類似一條小水管其實我們現在資料量太大了那水管永遠的是塞滿我們需要更大的水管更大的水管對我來說就是現在的網通就是我們用800G這種Port之類的現在到800G了現在目前還沒有到800G 現在主流是400G 雙400 當然我們要乘上時代的浪潮 800跟跟着這跟著這個AI的浪潮那我蠻好奇剛剛Vito哥有講到的 “參數” 參數概念要用什麼方法去理解它比較好到什麼參數？我簡單舉個簡單例子好了 2019年我在學習什麼叫做機器學習那我像Microsoft租了Azur的平臺做雲的那個？對那我用最簡單的方式我辨別什麼叫狗？狗 OK 帶他自己就上網站去找一堆的圖片來學習他抓了多少圖片？從我下下指令寫完Python 請他去抓到我隔天總共十一個小時他總共抓了700 我記得是790萬張圖片 795萬張圖片 790萬張就是 “參數” 那這跟剛剛講的那個ChatGPT 幾個億 1750億差很多耶代表他背後算的資料量非常大你資料量越大它就越準確因為有時候有些狗可能他正好長得像豹？就會誤解說這可能是豹這可能是貓讓你們猜猜我十一個小時訓練完之後他的最後正確的辨別率是多少？我猜猜看%數嗎 1 2 3

Johnny: 95% Ray: 13:15

30% 答案是78% 78差點就是不能再高87% 差一點我以為會很低耶 500萬張以圖片辨識來說 500萬以下可能達到你講的算很少的不算 500萬張以下可能就會像你講的因為他會落差很大對可是你想想你對人來講 500萬張這是一個多麼大的數字對啊我要看500萬隻狗我才認得出來他是狗你講的數字可能要到3000萬張才有好難以想像太厲害真的那這一集節目到尾聲了 Vito哥這邊有沒有什麼需要補充的部分呢？我覺得這集真的學習很多而且Vito哥用比較簡單的方式讓大家懂長知識到剛剛都有一點放空我想因為AI興起大家對AI 就是既期待又有點害怕了因為害怕會去做一些不正當的事像戰爭這類的事情了但是它又可以帶來給我們人類蠻多的便利提升了我們滿多的的效率那我覺得我們應該是用比較正確的方式去認知它因為它畢竟現在目前來看還有很多的極限它沒辦法做成的事情那我們當然希望AI 未來會越來越好但是目前來說我們應該是不管是在於愛護地球我們剛剛講能源的事情或者是我們新的科技的發展中間去取得一個平衡讓我們能夠既愛護地球又可以發展我們的科技是的而且它就是很重要的就是所謂的科技監管這些事情就是AI它產生像剛才Vito哥講的道德上面的問題對那這個東西的話是不是也是一個其實我們大家要關注的事情因為像馬斯克他們之前他其實有針對這些事情經過討論過是的而且他以前原本是在OpenAI 後來他退出時是有部分原因我記得也是跟這個東西有關沒錯沒錯也其實現在是大部分的无法可管所以也沒人知道可以運用在什麼地方嘛那現在目前來講最擔心的就是應用在戰爭你無人機搭配AI的話那真的是一個很可怕要怎麼去防範的所以需要有一些法律上的規範啊尤其是大家有共識後面怎麼變得那麼嚴肅不是要開心輕鬆的嗎我們來問一個簡單的問題好了順便問一下觀眾那收聽完這集顛覆了你原本對AI的想象了嗎？ A：才沒有我才是AI大師 B：超級顛覆我知識了！ C：你有其他的想法嗎？請在下方留言 OK 那有長知識嗎？學習這一集之後你就不悲哀會得到AI知識你在押韻喔？就不悲哀了雙壓這樣子跟我想像的悲哀是同一個嗎？你是說哪個你是只悲哀就悲哀你想到的悲哀是什麼有點冷掉哈哈哈哈反正會剪掉沒有應該不會看她想不想剪不要害我那Vito哥想的悲哀是什麼工廠的即使管理的BI 英文的是嗎我有點忘了 Build-in system? Brandon Ingram 中距離謝謝大家收聽今天的Take a Byte 科技咬一口還沒訂閱關注的朋友們請花一秒鐘的時間揍爆訂閱按鈕你也可以到各大Podcast平臺收聽我們的節目點擊下方連結追蹤我們的IG或搜尋Take a Byte 就能找到我們喔好勒期待下次見面！掰掰～

People on this episode

Ray

Host