.:: Livy ::.

2025年7月17日星期四

AI與漫畫2 動畫製作

紀錄一下，把上次做的動態分鏡做的更完整，

由於點數很快就用完了，

只能用低畫質或是換其他AI試用來生成，

拼拼奏奏也勉強算是完成吧，

從動態分鏡到目前進度大約一個星期，

若是加上故事到分鏡，再把剪輯加入，

整體工作時間應該在十二天左右，

如果還想要壓縮時間提高品質，

就得多花點錢買點數了

2025年7月15日星期二

AI頭像測試

紀錄一下，

使用AI測試頭像的過程，

得先聲明一下，

原圖是key上關鍵字頭像，搜尋得到，

有照片也有頭雕照片，

僅作為測試3D AI使用，並不作他用，

而AI 3D的模型也在測試後全數刪除。

這些模型幾乎全都使用單一張照片生成(僅第一張女生有側面)

先不論頭雕像不像，

光是能夠順利生成就已經夠驚人了，

搭上貼圖後，有種PS2遊戲機當時的模型感，

並不是特別像但是又勉強可以用，

至於成品好不好，CP值如何，

圖就放著自己就可以判斷囉；

那來講些我覺得值得一提的地方，

例如頭髮，因為只透過單張照片生成，

背後或是側邊的流向得對結構了解才有辦法做的好，

從李冰冰的模型來看，雖然誤判了有兩個髮髻，

但是從側面髮流方向，

可以知道AI是知道有兩個方向的拉扯，

當我注意到這點其實還蠻驚訝的，

又例如超人的頭髮，

更是交代的非常清楚，

所以特別還拍了張從頭頂看下來的方向；

再來是布料的皺摺表現，

從有衣服的這三個模型來看，

布的拉扯感、褶皺、材質都有不錯的表現，

可以說是照片生成中最令人滿意的地方，

我在想這應該是訓練的資料庫中，

應該有著大量的3D掃描模型；

再來是五官的結構，

雖然像的程度還是沒辦法達標，

但還是很順利生成眼耳口鼻等結構，

AI是真的明確知道這是一張臉，

再從資料庫中搜尋類似的結構來拼組，

再透過顏色深淺去判斷凹凸，

這不就和我們雕刻模型的原理一樣嗎，

那麼只要資料庫更多，提供參考圖的角度更多，

要生成更像的可能性就會提高的。

2025年7月9日星期三

AI 清除背景測試

本次測試使用原始圖片做測試，使用 "去除背景" 當提示詞，測試四套AI得到以下結果

chat gpt
速度慢效果優，將圖片真正去背為透明背景的 PNG格式，
而且也將圖片做了高清處理，
但也因此在臉部細節和原始圖片有稍微不同

google ai studio

速度快，將圖片做了白底的去被處理而非透明背景，邊緣認定也非常優秀。另外該AI尚未支援中文介面，因此輸入中文生成內容，比較容易出錯，建議使用英文或是翻譯軟體做提示詞，效果會更好

豆包

速度快，但理解上是將背景改成為白色背景，並保留環境光線變化，而非去除背景，圖片內容和原本圖片幾乎一樣

qwen

速度快，但理解上有問題，已經變成是另外一張圖，且圖片的寬高比產生變化，重新測試許多關鍵詞，都無法達標，所以並不適合做去背用。

2025年7月3日星期四

AI生成模型測試

最右側是AI生成的圖片，再透過AI將之轉為左側的 3D模型，細節上和結構上都已經相當驚人，由於沒有加入付費會員，都還只是透過正面圖做生成，若是以三視圖生成，應該會更加完美。

從素模來看，

整體和參考圖的接近度快八成了，

頭髮的結構都很不錯，

甚至還有些髮絲紋理，

褲子甚至還有些皺褶；

上色方面也是相當優秀，

AO都有加深處理，

臉部甚至還有雀斑的細節，

項鍊在素模沒有做出鍊條感，

而是在上色做處理，

還蠻聰明的。

AI與漫畫1 動態分鏡

整段流程是使用AI輔助生成，整體工作時間約為一天，

1. 使用AI生成故事 2. 使用AI產生腳本 3. 使用AI產生圖像 4. 使用AI生成人聲與配音 5. 剪輯請別太在意故事內容，就僅只是故事而已。

幾個月後，深夜的畫室裡，馬克筆在桌面上滾出半道弧線。漫畫家小林盯著螢幕上 AI 生成的分鏡稿，線條流暢得像是用了十年的筆尖劃出的，連他慣用的網點紙紋理都模仿得分毫不差。小林：“小張”，他頭也沒抬，聲音在寂靜裡顯得格外冷，小林：“這些背景和草稿以後 AI 都能做，你明天不用來了。” 角落裡正在削鉛筆的小張猛地抬頭，鉛筆芯斷在木質筆桿裡。他攥著半截鉛筆站了很久，終於把斷掉的鉛筆放在桌上。小張：“林老師，記得以前說過我們要做出……”，還沒說完，話音就被關門聲切斷。畫室裡只剩下滑鼠點擊的輕響。幾個月後，出版社編輯部。主編把小林的新稿丟回桌上，螢幕亮著 AI 自動生成的漫畫預覽。主編轉動著辦公椅，指尖敲著螢幕說：“小林啊，你看這劇情、這邏輯，分鏡節奏都比你更符合讀者偏好，畫技更是無可挑剔” 主編轉過身說：“最重要的是，現在供稿成本能壓到原來的三成，你這合約……” 小林的指甲掐進掌心，那疊畫了三個月的原稿突然變得無比沉重。他想起第一次拿稿費時，主編拍著他的肩說 “你的漫畫是有溫度的，我相信你的作品會更好的”。走出出版社，一陣冷風正吹過，小林蹲在路旁，看了腳邊乾枯碎裂的六月雪葉，很像當時小張離開時沒帶走的橡皮屑。幾個月後，捷運站許多柱子上都裝了螢幕廣告屏。螢幕裡 AI 根據使用者喜好，即時生成的畫面閃爍不定；有些學生低著頭看著手機漫畫，低頭對著螢幕說 “要甜寵加懸疑”，下一秒手機上的畫面就自動重組，產生了新的漫畫內容。小林路過曾經常去的書店，玻璃窗上貼著 “停業清倉” 的紅色大字。他看見書店老板正把最後一箱漫畫扔進回收車。小林：“老闆，怎麼會……” 書店老闆抹了把臉說：“沒人買了啊，出版社也快倒光了，讀者說 AI 能按他們的想法畫，誰還等出版社一期出一刊？追劇不也都一次看完嗎？” 回收車啟動時，小林聽見書本倒塌的嘩啦聲響，像是他的畫稿在碎紙機的聲音。小林掀起隨身帶著的速寫本，最後一頁是小張當時畫的 Q 版自畫像。旁邊歪歪扭扭寫著 “我們的作品會更好”。

2025年3月15日星期六

RIZOMUV筆記

2025年2月12日星期三

QTscrcpy筆記

QTscrcpy是一套開源的軟體，可以將手機畫面透過usb線或是wifi投映在電腦上，有PC版本以及mac版本，只需要進入手機開發者模式開啟usb調試即可連線，，連線品質和速度都非常優秀，值得推薦。以下是github的連結

https://github.com/barry-ran/QtScrcpy

2025年2月7日星期五

Topogun筆記

topogun這個軟體對我而言一直處在很奇怪的位置，

說他好用，的確有很多功能很強，

但是要說為了這些功能換軟體，

我個人又不太願意，

一方面是換軟體操作得換習慣，

而且流程還得轉換檔案嫌麻煩，

另一方面是我覺得topogun很多操作上都很不人性，

很多在別的軟體理所當然的功能，

在Topogun都沒有類似的處理，

例如使用快速鍵切換角度或是對其角度，

又或者是改視角操作方式或是自訂介面，

就是這些小地方讓我覺得他都沒考慮到使用者，

所以使用上總有種"不好用"的感覺，

不過這點也可能是被ZB或是blender，

這些優秀人性化的設計養慣了，

總之就是一直都覺得沒有非換到這邊拓補不可的感覺。

除非將來有機會做大量拓補的工作，

要不然針對單一模型的處理，

我想還是直接在原本的軟體處理，

雖然操作慢了點，

但換軟體得重新習慣花的時間，

或為了找類似功能花的時間，

可能也不會快到哪裡去。

2024年12月10日星期二

Suno筆記

Suno: https://suno.com/

只要點擊Create，song description輸入需要的prompt (支持中文)就可以生成，所以將prompt寫得越清楚，越容易得到優秀的作品，例如人聲、語系、節奏、樂器、情緒、風格…等，填寫完畢後，按下create song即可生成兩首相同歌詞不同旋律的歌曲。

如果不知道要怎麼填寫，可以使用Sunoprompt這個網站來輔助；或是利用現有的歌曲進行分析來模仿，可以利用Sonoteller:這個網站來得到模仿對象的相關音樂資訊。

若需要單純的音樂沒有人聲，可將instrumental開關關閉。

Suno目前沒有支持分軌，可以透過vocalremover進行人聲與音樂分離。

免費用戶每天都可以獲得50個credits(最多可以做十首歌)，並且不可以商用。

Sunoprompt: https://sunoprompt.com/zh

可以說是使用suno一定要使用的工具，透過填寫偏好，或是從下拉式選單選取各式內容，再按下 生成你的歌曲風格，即可產生所需的prompt，讓整體流程更加輕鬆，有中文。

Sonoteller: https://sonoteller.ai/

分析音樂的網站，可以將喜歡的音樂連結貼置網站內的搜尋，即可以獲得該歌曲的各式資訊:

Lyrics analysis歌詞分析		Music analysis音樂類型分析
Summary 概要		genres流派 subgenres次流派
moods情緒	language語系	moods情緒	節拍與音調BPM& KEY
themes主題	explicit字幕顯示	Instruments樂器	Vocals人聲