Category Archives: AI

LLaMA 心得

LLaMA是由Meta AI在2023年2月發布的大型語言模型。訓練了從70億到650億個參數的各種模型大小。

前一陣子試玩了一下,趁還有點記憶快點記錄一下記得的東西
大語言模型如果一般人要玩,最重要的前提是什麼都要大,要不然像 LLaMA 65B 就玩不動
如果是 65B 模型,硬碟最好準備至少 1T 最好 2T 的硬碟,因為還要加上轉檔,當然是用 SSD 才會快,原始檔 7B: 13G 13B 25G 33B(Meta 筆誤 30B ,都是通用的)61G,65B 122G,共約 220G

Read more »

Run Keras or TensorFlow in WSL2 with Nvidia GPU

When this article is finished, it will still be unable to run Keras or TensorFlow within Conda or a virtual environment. This is because TensorFlow/Keras will display an error message similar to the one below (cut):

Node: 'model_3/conv1d_24/Conv1D' 
DNN library is not found. 	 [[{{node model_3/conv1d_24/Conv1D}}]] [Op:__inference_train_function_34509]

It seems that there may be compatibility issues between the versions of TensorFlow/Keras installed outside of Conda and those installed within Conda. But it maybe also cause by tensorflow 2.12 has issue, please re-install 2.10 and try again .
Specified version can work well cuDNN 8.9, CUDA 11.8 and TensorFlow 2.10.
Here is how to re-install tensorflow 2.10 instruction.

Read more »

Generative AI(生成式AI)/ChatGPT

這篇不是一篇技術文章,而是心得文
身為一個曾經利用 AI 來撰寫論文的博士研究生,對於在過去的一年中Generative AI(生成式 AI ) 取得了顯著的成就感到些許的驚訝。雖然我沒能早點預見到這股浪潮,但是有幸在這股巨浪來臨之前站穩腳步,避免了在口試時的尷尬和對自己期望的失望。

近期,各種關於 ChatGPT 的文章層出不窮,大家的觀點都非常有道理。然而,我認為是時候分享我的看法,畢竟這個bblog已經存在了十多年,偶爾回顧過去的想法是有趣的,特別是當下和未來預測之間的對比。或許這個 WordPress 博客可以一直維持到我退休,屆時再看看我的看法是否準確。

Read more »