2025年7月9日 星期三

AI 清除背景測試

 本次測試 使用原始圖片做測試,使用  "去除背景" 當提示詞,測試四套AI得到以下結果

chat gpt
速度慢效果優,將圖片真正去背為透明背景的 PNG格式,
而且也將圖片做了高清處理,
但也因此在臉部細節和原始圖片有稍微不同



google ai studio

速度快,將圖片做了白底的去被處理而非透明背景,邊緣認定也非常優秀。另外該AI尚未支援中文介面,因此輸入中文生成內容,比較容易出錯,建議使用英文或是翻譯軟體做提示詞,效果會更好


豆包

速度快,但理解上是將背景改成為白色背景,並保留環境光線變化,而非去除背景,圖片內容和原本圖片幾乎一樣


qwen

速度快,但理解上有問題,已經變成是另外一張圖,且圖片的寬高比產生變化,重新測試許多關鍵詞,都無法達標,所以並不適合做去背用。



2025年7月3日 星期四

AI生成模型測試

最右側是AI生成的圖片, 再透過AI將之轉為左側的 3D模型, 細節上和結構上都已經相當驚人, 由於沒有加入付費會員, 都還只是透過正面圖做生成, 若是以三視圖生成,應該會更加完美。

從素模來看,
整體和參考圖的接近度快八成了,
頭髮的結構都很不錯,
甚至還有些髮絲紋理,
褲子甚至還有些皺褶;
上色方面也是相當優秀,
AO都有加深處理,
臉部甚至還有雀斑的細節,
項鍊在素模沒有做出鍊條感,
而是在上色做處理,
還蠻聰明的。



AI與漫畫

整段流程是使用AI輔助生成, 整體工作時間約為一天,

1. 使用AI生成故事 2. 使用AI產生腳本 3. 使用AI產生圖像 4. 使用AI生成人聲與配音 5. 剪輯 請別太在意故事內容, 就僅只是故事而已。

幾個月後,深夜的畫室裡,馬克筆在桌面上滾出半道弧線。 漫畫家小林盯著螢幕上 AI 生成的分鏡稿,線條流暢得像是用了十年的筆尖劃出的,連他慣用的網點紙紋理都模仿得分毫不差。 小林:“小張”, 他頭也沒抬,聲音在寂靜裡顯得格外冷, 小林:“這些背景和草稿以後 AI 都能做,你明天不用來了。” 角落裡正在削鉛筆的小張猛地抬頭,鉛筆芯斷在木質筆桿裡。 他攥著半截鉛筆站了很久,終於把斷掉的鉛筆放在桌上。 小張:“林老師,記得以前說過我們要做出……”, 還沒說完,話音就被關門聲切斷。 畫室裡只剩下滑鼠點擊的輕響。 幾個月後,出版社編輯部。 主編把小林的新稿丟回桌上,螢幕亮著 AI 自動生成的漫畫預覽。 主編轉動著辦公椅,指尖敲著螢幕說:“小林啊,你看這劇情、這邏輯,分鏡節奏都比你更符合讀者偏好,畫技更是無可挑剔” 主編轉過身說:“最重要的是,現在供稿成本能壓到原來的三成,你這合約……” 小林的指甲掐進掌心,那疊畫了三個月的原稿突然變得無比沉重。 他想起第一次拿稿費時,主編拍著他的肩說 “你的漫畫是有溫度的,我相信你的作品會更好的”。 走出出版社,一陣冷風正吹過,小林蹲在路旁, 看了腳邊乾枯碎裂的六月雪葉,很像當時小張離開時沒帶走的橡皮屑。 幾個月後,捷運站許多柱子上都裝了螢幕廣告屏。 螢幕裡 AI 根據使用者喜好,即時生成的畫面閃爍不定; 有些學生低著頭看著手機漫畫,低頭對著螢幕說 “要甜寵加懸疑”, 下一秒手機上的畫面就自動重組,產生了新的漫畫內容。 小林路過曾經常去的書店,玻璃窗上貼著 “停業清倉” 的紅色大字。 他看見書店老板正把最後一箱漫畫扔進回收車。 小林:“老闆,怎麼會……” 書店老闆抹了把臉說:“沒人買了啊,出版社也快倒光了,讀者說 AI 能按他們的想法畫,誰還等出版社一期出一刊?追劇不也都一次看完嗎?” 回收車啟動時,小林聽見書本倒塌的嘩啦聲響,像是他的畫稿在碎紙機的聲音。 小林掀起隨身帶著的速寫本,最後一頁是小張當時畫的 Q 版自畫像。 旁邊歪歪扭扭寫著 “我們的作品會更好”。

2025年2月12日 星期三

QTscrcpy筆記

QTscrcpy是一套開源的軟體,可以將手機畫面透過usb線或是wifi投映在電腦上,有PC版本以及mac版本,只需要進入手機開發者模式開啟usb調試即可連線,,連線品質和速度都非常優秀,值得推薦。 以下是github的連結 

https://github.com/barry-ran/QtScrcpy 

2025年2月7日 星期五

Topogun筆記

topogun這個軟體對我而言一直處在很奇怪的位置,
說他好用,的確有很多功能很強,
但是要說為了這些功能換軟體,
我個人又不太願意,
一方面是換軟體操作得換習慣,
而且流程還得轉換檔案嫌麻煩,
另一方面是我覺得topogun很多操作上都很不人性,
很多在別的軟體理所當然的功能,
在Topogun都沒有類似的處理,
例如使用快速鍵切換角度或是對其角度,
又或者是改視角操作方式或是自訂介面,
就是這些小地方讓我覺得他都沒考慮到使用者,
所以使用上總有種"不好用"的感覺,
不過這點也可能是被ZB或是blender,
這些優秀人性化的設計養慣了,
總之就是一直都覺得沒有 非換到這邊拓補不可的感覺。
除非將來有機會做大量拓補的工作,
要不然針對單一模型的處理,
我想還是直接在原本的軟體處理,
雖然操作慢了點,
但換軟體得重新習慣花的時間,
或為了找類似功能花的時間,
可能也不會快到哪裡去。

 

 

2024年12月10日 星期二

Suno筆記

 

Suno: https://suno.com/

只要點擊Createsong description輸入需要的prompt (支持中文)就可以生成,所以將prompt寫得越清楚,越容易得到優秀的作品,例如人聲、語系、節奏、樂器、情緒、風格等,填寫完畢後,按下create song即可生成兩首相同歌詞不同旋律的歌曲。

如果不知道要怎麼填寫,可以使用Sunoprompt這個網站來輔助;或是利用現有的歌曲進行分析來模仿,可以利用Sonoteller:這個網站來得到模仿對象的相關音樂資訊。

若需要單純的音樂沒有人聲,可將instrumental開關關閉

Suno目前沒有支持分軌,可以透過vocalremover進行人聲與音樂分離。

免費用戶每天都可以獲得50credits(最多可以做十首歌),並且不可以商用。

Sunoprompt: https://sunoprompt.com/zh

可以說是使用suno一定要使用的工具,透過填寫偏好,或是從下拉式選單選取各式內容,再按下 生成你的歌曲風格,即可產生所需的prompt,讓整體流程更加輕鬆,有中文。

 

Sonoteller: https://sonoteller.ai/

分析音樂的網站,可以將喜歡的音樂連結貼置網站內的搜尋,即可以獲得該歌曲的各式資訊:

Lyrics analysis歌詞 分析

Music analysis音樂類型 分析

Summary 概要

genres流派

subgenres次流派

moods情緒

language語系

moods情緒

節拍與音調BPM& KEY

themes主題

explicit字幕顯示

Instruments樂器

Vocals人聲

 

Vocalremover: https://vocalremover.org/zh/

音樂處理的網站,可以處理去除人聲、聲音變調、查詢BMP&key、線上剪輯、錄音、卡拉OK等使用,有中文去除人聲,可以單獨將人聲或音樂另存,很實用。

免費用戶一天只能處理一份,以及十分鐘的限制。