2025年7月17日 星期四

AI與漫畫2 動畫製作

紀錄一下, 把上次做的動態分鏡做的更完整,

由於點數很快就用完了,
只能用低畫質或是換其他AI試用來生成,
拼拼奏奏也勉強算是完成吧,
從動態分鏡到目前進度大約一個星期,
若是加上故事到分鏡,再把剪輯加入,
整體工作時間應該在十二天左右,
如果還想要壓縮時間提高品質,
就得多花點錢買點數了

2025年7月15日 星期二

AI頭像測試

 紀錄一下,

使用AI測試頭像的過程,
得先聲明一下,
原圖是key上關鍵字 頭像,搜尋得到,
有照片也有頭雕照片,
僅作為測試3D AI使用,並不作他用,
而AI 3D的模型也在測試後全數刪除 。
這些模型幾乎全都使用單一張照片生成(僅第一張女生有側面)
先不論頭雕像不像,
光是能夠順利生成就已經夠驚人了,
搭上貼圖後,有種PS2遊戲機當時的模型感,
並不是特別像但是又勉強可以用,
至於成品好不好,CP值如何,
圖就放著自己就可以判斷囉;
那來講些我覺得值得一提的地方,
例如頭髮,因為只透過單張照片生成,
背後或是側邊的流向得對結構了解才有辦法做的好,
從李冰冰的模型來看,雖然誤判了有兩個髮髻,
但是從側面髮流方向,
可以知道AI是知道有兩個方向的拉扯,
當我注意到這點其實還蠻驚訝的,
又例如超人的頭髮,
更是交代的非常清楚,
所以特別還拍了張從頭頂看下來的方向;
再來是布料的皺摺表現,
從有衣服的這三個模型來看,
布的拉扯感、褶皺、材質都有不錯的表現,
可以說是照片生成中最令人滿意的地方,
我在想這應該是訓練的資料庫中,
應該有著大量的3D掃描模型;
再來是五官的結構,
雖然像的程度還是沒辦法達標,
但還是很順利生成 眼 耳 口 鼻等結構,
AI是真的明確知道這是一張臉,
再從資料庫中搜尋類似的結構來拼組,
再透過顏色深淺去判斷凹凸,
這不就和我們雕刻模型的原理一樣嗎,
那麼只要資料庫更多,提供參考圖的角度更多,
要生成更像的可能性就會提高的。










2025年7月9日 星期三

AI 清除背景測試

 本次測試 使用原始圖片做測試,使用  "去除背景" 當提示詞,測試四套AI得到以下結果

chat gpt
速度慢效果優,將圖片真正去背為透明背景的 PNG格式,
而且也將圖片做了高清處理,
但也因此在臉部細節和原始圖片有稍微不同



google ai studio

速度快,將圖片做了白底的去被處理而非透明背景,邊緣認定也非常優秀。另外該AI尚未支援中文介面,因此輸入中文生成內容,比較容易出錯,建議使用英文或是翻譯軟體做提示詞,效果會更好


豆包

速度快,但理解上是將背景改成為白色背景,並保留環境光線變化,而非去除背景,圖片內容和原本圖片幾乎一樣


qwen

速度快,但理解上有問題,已經變成是另外一張圖,且圖片的寬高比產生變化,重新測試許多關鍵詞,都無法達標,所以並不適合做去背用。



2025年7月3日 星期四

AI生成模型測試

最右側是AI生成的圖片, 再透過AI將之轉為左側的 3D模型, 細節上和結構上都已經相當驚人, 由於沒有加入付費會員, 都還只是透過正面圖做生成, 若是以三視圖生成,應該會更加完美。

從素模來看,
整體和參考圖的接近度快八成了,
頭髮的結構都很不錯,
甚至還有些髮絲紋理,
褲子甚至還有些皺褶;
上色方面也是相當優秀,
AO都有加深處理,
臉部甚至還有雀斑的細節,
項鍊在素模沒有做出鍊條感,
而是在上色做處理,
還蠻聰明的。



AI與漫畫1 動態分鏡

整段流程是使用AI輔助生成, 整體工作時間約為一天,

1. 使用AI生成故事 2. 使用AI產生腳本 3. 使用AI產生圖像 4. 使用AI生成人聲與配音 5. 剪輯 請別太在意故事內容, 就僅只是故事而已。

幾個月後,深夜的畫室裡,馬克筆在桌面上滾出半道弧線。 漫畫家小林盯著螢幕上 AI 生成的分鏡稿,線條流暢得像是用了十年的筆尖劃出的,連他慣用的網點紙紋理都模仿得分毫不差。 小林:“小張”, 他頭也沒抬,聲音在寂靜裡顯得格外冷, 小林:“這些背景和草稿以後 AI 都能做,你明天不用來了。” 角落裡正在削鉛筆的小張猛地抬頭,鉛筆芯斷在木質筆桿裡。 他攥著半截鉛筆站了很久,終於把斷掉的鉛筆放在桌上。 小張:“林老師,記得以前說過我們要做出……”, 還沒說完,話音就被關門聲切斷。 畫室裡只剩下滑鼠點擊的輕響。 幾個月後,出版社編輯部。 主編把小林的新稿丟回桌上,螢幕亮著 AI 自動生成的漫畫預覽。 主編轉動著辦公椅,指尖敲著螢幕說:“小林啊,你看這劇情、這邏輯,分鏡節奏都比你更符合讀者偏好,畫技更是無可挑剔” 主編轉過身說:“最重要的是,現在供稿成本能壓到原來的三成,你這合約……” 小林的指甲掐進掌心,那疊畫了三個月的原稿突然變得無比沉重。 他想起第一次拿稿費時,主編拍著他的肩說 “你的漫畫是有溫度的,我相信你的作品會更好的”。 走出出版社,一陣冷風正吹過,小林蹲在路旁, 看了腳邊乾枯碎裂的六月雪葉,很像當時小張離開時沒帶走的橡皮屑。 幾個月後,捷運站許多柱子上都裝了螢幕廣告屏。 螢幕裡 AI 根據使用者喜好,即時生成的畫面閃爍不定; 有些學生低著頭看著手機漫畫,低頭對著螢幕說 “要甜寵加懸疑”, 下一秒手機上的畫面就自動重組,產生了新的漫畫內容。 小林路過曾經常去的書店,玻璃窗上貼著 “停業清倉” 的紅色大字。 他看見書店老板正把最後一箱漫畫扔進回收車。 小林:“老闆,怎麼會……” 書店老闆抹了把臉說:“沒人買了啊,出版社也快倒光了,讀者說 AI 能按他們的想法畫,誰還等出版社一期出一刊?追劇不也都一次看完嗎?” 回收車啟動時,小林聽見書本倒塌的嘩啦聲響,像是他的畫稿在碎紙機的聲音。 小林掀起隨身帶著的速寫本,最後一頁是小張當時畫的 Q 版自畫像。 旁邊歪歪扭扭寫著 “我們的作品會更好”。

2025年2月12日 星期三

QTscrcpy筆記

QTscrcpy是一套開源的軟體,可以將手機畫面透過usb線或是wifi投映在電腦上,有PC版本以及mac版本,只需要進入手機開發者模式開啟usb調試即可連線,,連線品質和速度都非常優秀,值得推薦。 以下是github的連結 

https://github.com/barry-ran/QtScrcpy 

2025年2月7日 星期五

Topogun筆記

topogun這個軟體對我而言一直處在很奇怪的位置,
說他好用,的確有很多功能很強,
但是要說為了這些功能換軟體,
我個人又不太願意,
一方面是換軟體操作得換習慣,
而且流程還得轉換檔案嫌麻煩,
另一方面是我覺得topogun很多操作上都很不人性,
很多在別的軟體理所當然的功能,
在Topogun都沒有類似的處理,
例如使用快速鍵切換角度或是對其角度,
又或者是改視角操作方式或是自訂介面,
就是這些小地方讓我覺得他都沒考慮到使用者,
所以使用上總有種"不好用"的感覺,
不過這點也可能是被ZB或是blender,
這些優秀人性化的設計養慣了,
總之就是一直都覺得沒有 非換到這邊拓補不可的感覺。
除非將來有機會做大量拓補的工作,
要不然針對單一模型的處理,
我想還是直接在原本的軟體處理,
雖然操作慢了點,
但換軟體得重新習慣花的時間,
或為了找類似功能花的時間,
可能也不會快到哪裡去。

 

 

2024年12月10日 星期二

Suno筆記

 

Suno: https://suno.com/

只要點擊Createsong description輸入需要的prompt (支持中文)就可以生成,所以將prompt寫得越清楚,越容易得到優秀的作品,例如人聲、語系、節奏、樂器、情緒、風格等,填寫完畢後,按下create song即可生成兩首相同歌詞不同旋律的歌曲。

如果不知道要怎麼填寫,可以使用Sunoprompt這個網站來輔助;或是利用現有的歌曲進行分析來模仿,可以利用Sonoteller:這個網站來得到模仿對象的相關音樂資訊。

若需要單純的音樂沒有人聲,可將instrumental開關關閉

Suno目前沒有支持分軌,可以透過vocalremover進行人聲與音樂分離。

免費用戶每天都可以獲得50credits(最多可以做十首歌),並且不可以商用。

Sunoprompt: https://sunoprompt.com/zh

可以說是使用suno一定要使用的工具,透過填寫偏好,或是從下拉式選單選取各式內容,再按下 生成你的歌曲風格,即可產生所需的prompt,讓整體流程更加輕鬆,有中文。

 

Sonoteller: https://sonoteller.ai/

分析音樂的網站,可以將喜歡的音樂連結貼置網站內的搜尋,即可以獲得該歌曲的各式資訊:

Lyrics analysis歌詞 分析

Music analysis音樂類型 分析

Summary 概要

genres流派

subgenres次流派

moods情緒

language語系

moods情緒

節拍與音調BPM& KEY

themes主題

explicit字幕顯示

Instruments樂器

Vocals人聲

 

Vocalremover: https://vocalremover.org/zh/

音樂處理的網站,可以處理去除人聲、聲音變調、查詢BMP&key、線上剪輯、錄音、卡拉OK等使用,有中文去除人聲,可以單獨將人聲或音樂另存,很實用。

免費用戶一天只能處理一份,以及十分鐘的限制。

2024年6月5日 星期三

光固化打印機 後續添購物品紀錄

 入手光固打印機後,

還有不少東西需要添購,
幸好去一趟五金行應該就可以搞定了,
這邊記錄一下,
另外想入手這個 水陸兩用沉水馬達,
看價格才109算是很便宜,
宣傳內也有寫著可以抽取清潔液、酒精,
那這樣應該就沒問題,
主要是想要用來抽取 清潔桶 內的酒精用,
雖然不是很常清洗 清潔桶,
但是用倒的方式,幾乎每次都會有狀況,
而且如果用抽取式的方式,
還可以再末端加個過濾海綿或是濾網之類的,
讓回收的酒精更加乾淨,

-------------以下-----------------
鏟刀:
將列印件從平台上鏟下使用,這個只要不要摔應該可以用非常非常久。


瀝水盤:
之前看別人都是推薦使用托盤,但瀝水盤應該更好,因為有多餘的空間容納滴下去樹酯或是酒精,最好準備兩個,一個放置鏟下的列印件,另一個是放置清洗後的物件。


濾茶器:
用來將剩餘的樹酯到回去罐子時過濾使用,網目能多細就多細,如果能買到錐形的就不用買漏斗。


漏斗:
用來將剩餘的樹酯到回去罐子使用。


餐巾紙:
用來擦拭滴落的樹酯或是酒精,可以用舊的衣服或抹布替代。
鋼刷:
可將列印平台刷出刮痕增加附著力用,以及刷除清洗桶內像是炸雞網上像是藤壺的附著物。


烤肉夾:
幫你夾起掉在清洗桶內的列印件,在清洗時也可以輔助使用增加距離。


漏網:
將清洗桶內漂浮的殘渣撈起來使用,網目能多細就多細。


手套:
清洗時一定要帶,要不然手很容易會過敏發癢,原本是買橡膠的比較合,但是因為穿脫容易黏手比較不方便,後來改用PVC無粉手套的,而且要大一點,至於手扒雞那種的就算了,很容易被列印件刺破,幾乎無效。


UV手電筒:
可以輔助照射簍空內側,固化燈照射不到的地方,也可以用於UV補土固化用。


風槍或吹風機:
將清洗後的物件吹乾使用,有空壓機配風槍威力比較強,如果沒有的話,使用吹風機就夠用了,但是比較麻煩的是電源的問題,所以能夠無線是最好的,我有上網買了無線吹(吸)塵槍,剛開始還蠻好用的,只是他的續航力太差,會再找看看有沒有更好的選擇。


砂紙:
將列印件做打磨用。
斜口鉗:
拆支撐時用,但我比較常用剪指甲的小剪刀和斜口指甲剪,處理細節更順手。




鍋蓋把手:
打印機和光固機的蓋子設計的方方正正的,雖然好看但是得要兩隻手捧著才可以掀起,所以如果想要單手就可以拿起來,可以加裝這個,對我而言方便許多。


2024年3月7日 星期四

讓照片開口講話

 記得二十多年前,

購買WEBCAM時附贈了幾片光碟,
裡頭有甲尚科技出品的軟體,
[我是大明星還有CRAZYTALK]
主打的就是 讓照片動起來 這回事。

我是大明星的內容是有一個人體模型,
已經建立好一些固定動作和背景,
然後可以將自己的照片變成模型的貼圖,
就可以看到自己在畫面中跳來跳去的樣子,
不能調整動作也不能互動,
但是看到自己變成螢幕內的模型依舊玩的不亦樂乎;



而CRAZYTALK則可以讓平面的照片,
透過一些簡單的操作,讓嘴巴和眼睛的網格動起來,
可以做出很多有趣的表情操作,
而這套軟體後來功能發展越來越強,
已經不僅只是平面的效果了。
這些年也出了不少讓照片開口講話的APP,
只是這些工具大都是將照片貼入內建的模型貼圖,
還是會受限於模型的網格面數,
因此都會看到有菱有角的結構邊緣,
還是一看就知道這並非真實的人物動作或是表情。
而2d ai興起後,已經有不少ai動畫的作品,
總是覺得幀跳動很明顯導致不夠流暢,
直到最近看到阿里巴巴研究的emo技術的這些影片,
實在很難相信真的只是單一張照片的成果,
看到張國榮唱歌的那段,
讓無法再見到面的人再次開口,
應該會讓很多粉絲流淚吧!



補上甲尚科技的相關連結

2024年3月6日 星期三

3D AI 測試

 連結先放

用關鍵詞生成的模型,
只要不是做實體輸出,
在現階段快到堪用邊緣了。
而用照片生成的模型,
只能驚嘆速度之快後再對品質搖搖頭,
畢竟單一畫面,
可以得到的資訊實在太少,
而3d又不同於2D只單看某個角度,
所以即使繼續發展,
還是比較值得期待使用關鍵字生成的方式。