與 AI 共舞

Raymond Li

近幾個(gè)月來(lái)，AI （artificial intelligence）在各個(gè)領(lǐng)域的應(yīng)用火得很。社會(huì)對(duì)此的反應(yīng)是萬(wàn)家歡樂(lè)幾家愁。 朋友的女兒在谷歌公司工作，她給我們展示了一個(gè)長(zhǎng)長(zhǎng)的清單，列舉了一系列領(lǐng)域現(xiàn)有的各種 AI 應(yīng)用系統(tǒng)的名稱。這些領(lǐng)域涵蓋了視頻、音頻、圖像、專業(yè)報(bào)告、科學(xué)研究、工程設(shè)計(jì)、企業(yè)管理、以及資料查詢。 在 AI浪潮的沖擊下，攝影師們有點(diǎn)茫然，眾多的攝影愛(ài)好者更是不知所從。于是，美國(guó)全國(guó)各地的十九個(gè)華人攝影協(xié)會(huì)在七月中聯(lián)合舉辦了專題講座，請(qǐng)西悉尼大學(xué)人工智能研究室的教授、廣為人知的北美四光圈攝影師張熖作了《生成式人工智能及其對(duì)攝影的沖擊》的科學(xué)講座。 十九個(gè)攝影協(xié)會(huì)！僅其中的一個(gè)，硅谷的“灣區(qū)攝影天地”在世界各地的成員就有500人之多。“都瘋了！”有人禁不住脫口而出。 為誰(shuí)而瘋？為攝影，還是為 AI？ 該來(lái)的，終究還是來(lái)了。 圖一，2016年9月22日早晨，本文作者在塞倫蓋蒂草原上拍攝的日出景色之一。 　　該來(lái)的，終究還是來(lái)了。 故事還要從這篇文章的封面說(shuō)起。封面所用的照片還是2016年秋天的一個(gè)早晨，在坦桑尼亞塞倫蓋蒂的短草平原上拍攝的。 原來(lái)的照片（見(jiàn)圖一）上只有斑馬和初升的太陽(yáng)?，F(xiàn)在封面照片右側(cè)的天空中出現(xiàn)了一行飛鳥(niǎo)。這樣是不是在構(gòu)圖上平衡一些了？否則上半部分顯得有點(diǎn)空曠。 那些鳥(niǎo)是 AI 在自行判斷后給加上去的。 圖一，2016年9月，我們攝影隊(duì)在前往坦桑尼亞塞倫蓋蒂馬拉河流域的路途中。 　　那次我們一行四人經(jīng)肯尼亞的內(nèi)羅畢轉(zhuǎn)去坦桑的阿魯沙，再乘坐Toyata 的皮卡進(jìn)草原。幾個(gè)人在山丘、河谷、以及荒原上奔波了半個(gè)月，簡(jiǎn)直疲憊不堪。不只是早出晚歸，還有一路風(fēng)塵。 北京來(lái)的野生動(dòng)物攝影師、我們的一位好朋友去過(guò)非洲很多次，那回也忍不住發(fā)了一通感慨。他坐在顛得骨頭架子都要散了的卡車上，一邊用雙手緊緊攥柱扶手一邊說(shuō)：“以后科學(xué)發(fā)達(dá)了，我們就不用親自到這地方來(lái)了。坐在家里，操縱無(wú)人機(jī)，想到哪拍就到哪拍，想怎么拍就怎么拍?！?lt;/p> 當(dāng)時(shí)車上的人都笑了，同時(shí)也都沉浸在夢(mèng)中。沒(méi)想到，該來(lái)的，終究還是來(lái)了，而且還來(lái)得那么快。 只不過(guò)，這回不僅不用肉身去非洲了，而且也不用隔著大半個(gè)地球操控?zé)o人機(jī)，白天晩上地盯著遙控器的屏幕，追著動(dòng)物按快門了?，F(xiàn)在只要坐在電腦前，按按鼠標(biāo)，就能“制造”出各種環(huán)境里的各種形態(tài)的獅子、獵豹、花豹、角馬，還有犀牛了。 Adobe 公司的“判別式 AI 降噪”和“生成式 AI 填充”工具 　　人工智能的研究從上個(gè)世紀(jì)五十年代早期就開(kāi)始了，至今經(jīng)歷了兩個(gè)發(fā)展階段。第一個(gè)階段的是“判別式人工智能（Discriminative AI）”，第二個(gè)階段的是1966年以來(lái)的“生成式人工智能（Generative AI）”。 現(xiàn)階段的生成式人工智能系統(tǒng)使用機(jī)器來(lái)學(xué)習(xí)大量的視覺(jué)和文本等形式的數(shù)據(jù)，然后按照使用者的需要，根據(jù)一定的算法計(jì)算出最有可能出現(xiàn)的結(jié)果，再以視覺(jué)和文本等形式輸出數(shù)據(jù)。 在整個(gè)過(guò)程中算法十分重要。目前的幾種算法當(dāng)中，穩(wěn)定擴(kuò)散模型（stable diffusion model）在生成圖像方面著有成效。 Adobe 公司的“判別式 AI 降噪”工具 圖三，與 photoshop 配套使用的 Camera Raw 15.4 版細(xì)節(jié)處理工具欄的截圖。截圖的下方增加了 Noise Reduction （降噪）的按鈕。按鈕下面的注解說(shuō)：用 AI 去噪。所生成的圖像以 DNG 格式存儲(chǔ)。 　　近一年來(lái)，Adobe 公司先是在三個(gè)圖像后期預(yù)處理軟件的功能上使用了判別式人工智能技術(shù)，而且都取得了應(yīng)用程度的進(jìn)展。 這三個(gè)功能分別是：1）超級(jí)分辨率；2）細(xì)化；3）降噪。 我們?cè)谶@里稍微多說(shuō)幾句與降噪有關(guān)的事。 今年4月，Adobe 公司在其 Camera Raw 15.3 版，Lightroom 6.3 版和 Lightroom Classic 12.3 版上推出了AI 降噪功能。 圖三是與 photoshop 配套使用的 Camera Raw 細(xì)節(jié)處理工具欄的截圖。截圖的下方增加了去噪的按鈕。按鈕上面注明：“用 AI 降噪”。 目前 Adobe 公司開(kāi)發(fā)出來(lái)的這一人工智能降噪的功能，只能適用于具有 Bayer Pattern 和 X-Trans Pattern 圖像傳感器的照相機(jī)的源文件（Raw File）。舉例來(lái)說(shuō)，佳能的單反和無(wú)反相機(jī)使用前一種傳感器，而富士相機(jī)使用后一種傳感器。 經(jīng)過(guò)對(duì)不同廠家出產(chǎn)的降噪軟件進(jìn)行比較，Adobe 的 AI 降噪插件在去除噪點(diǎn)和保留原有細(xì)節(jié)方面效果最為顯著。 Adobe 公司的“生成式 AI 填充”工具 圖四，Adobe photoshop （Beta）版編輯工具欄截圖。除了原有的“填充”和“內(nèi)容感知填充”工具外，Beta 版新增了“生成式填充（Generative Fill）工具。 　　上面所說(shuō)的 Adobe 的 AI 去噪工具是判別式人工智能技術(shù)的產(chǎn)物，而最近它推出的生成式填充工具則是生成式人工智能的應(yīng)用。 事情是這樣的，今年六月份，Adobe 在其產(chǎn)品欄目里推出了一款生成式 AI 的獨(dú)立應(yīng)用系統(tǒng)，名字叫做 Firefly（螢火蟲(chóng)），面向各??行業(yè)的圖像制作者。才過(guò)了一個(gè)月時(shí)間，這款應(yīng)用程序就被加入到 photoshop （Beta）版中，成為了“生成式填充”工具。在這里，Beta 版就是試行版。 至此，在目前的 Beta 版 photoshop 里就同時(shí)擁有三種不同的填充工具。參見(jiàn)圖四。 這三種填充工具如下： Fill（填充）：原有。用于在選擇區(qū)域內(nèi)作按照自動(dòng)實(shí)行內(nèi)容感知填充，或者按照攝影師的要求填充顏色、50%灰度、圖像。該工具不能自主生成圖像。 Content-Aware Fill（內(nèi)容感知填充）：原有。由攝影師先行選取內(nèi)容周邊的感知區(qū)域，然后實(shí)行填充。該工具不能自主生成圖像。 Generative Fill（生成式填充）：新增。用于兩種指令情況。一種是攝影師不作為，任由人工智能系統(tǒng)生成它自己認(rèn)為最合適的圖像。第二種是攝影師輸入文字指令，再由人工智能系統(tǒng)輸出比較接近操作人員所要求的圖像。 本文主要介紹生成式填充工具的應(yīng)用和期望。 生成式填充工具應(yīng)用之一：哥本哈根新港的擴(kuò)展 圖五，哥本哈根的新港。本文作者于2023年3月攝于丹麥哥本哈根。 　　新港 (Nyhavn) 是丹麥哥本哈根的 17 世紀(jì)的海濱、運(yùn)河和娛樂(lè)區(qū)。它從國(guó)王新廣場(chǎng) (Kongens Nytorv) 一直延伸到皇家劇院 (Royal Playhouse) 以南的海濱，兩旁排列著色彩鮮艷的 17 世紀(jì)和 18 世紀(jì)初的聯(lián)排別墅以及酒吧、咖啡館和餐館。中世紀(jì)之后北歐的大航海巨幕從這里開(kāi)啟。安徒生老先生曾先后兩次在新港居住。 新港的航道為西北-東南方向，向外通往北海。航道兩邊樓房的外面依次是人行道、馬路，再就是碼頭。 圖六，將圖五照片的畫(huà)布（canvas）向右側(cè)（出海口方向）延伸原照片寬度的1/4。 圖七，在生成式填充對(duì)話框的指令輸入窗口（What would you like to generate?）里（見(jiàn)圖像右下角的對(duì)話框）不輸入任何文字指令。然后按下對(duì)話框右邊的執(zhí)行鍵（Generate）之后AI 自動(dòng)生成的擴(kuò)展圖像之一。 　　不輸入任何指令，于是 AI 給出三個(gè)選項(xiàng)。上面這張是其中的一個(gè)選項(xiàng)。它將原有的河道按照透視規(guī)則向右擴(kuò)展。天空的云層，房屋建筑、碼頭、?？康拇?、以及水道都顯得很自然。 圖八，在生成式填充對(duì)話框的指令輸入窗口輸入如下指令：“Open to sea（通往海洋）”，接著按下旁邊的執(zhí)行鍵，AI 自動(dòng)生成的擴(kuò)展圖像之一。 　　AI 給出的選項(xiàng)之一，是在樓房的右側(cè)出現(xiàn)了一個(gè)修船的船塢，然后就是大海。 圖九，在生成式填充對(duì)話框的指令輸入窗口輸入如下指令：Open to sea（通往海洋），接著按下旁邊的執(zhí)行鍵，AI 自動(dòng)生成的擴(kuò)展圖像之二。 　　AI 給出的另一個(gè)選項(xiàng)，是在樓房的終端停了幾條舊船，接著就是出?？诹恕：降乐虚g還有一艘船正在駛出港口。 生成式填充工具應(yīng)用之二：哥本哈根酒店的旋轉(zhuǎn)樓梯 圖十，哥本哈根 Radisson Collection Copenhagen 酒店大堂里連接一樓和二樓的旋轉(zhuǎn)樓梯。本文作者于2023年3月拍攝。 　　在從哥本哈根返回奧斯陸的那天中午，我們?cè)谙麻降腞adisson Collection Copenhagen 酒店大堂里等出租車。借此機(jī)會(huì)用手機(jī)拍攝了大堂里連接一樓和二樓的一座旋轉(zhuǎn)樓梯。 這是一家由著名設(shè)計(jì)師和建筑師 Arne Jacobsen 設(shè)計(jì)的酒店，使其成為丹麥現(xiàn)代主義的真正發(fā)源地。酒店建于 1960 年。當(dāng)時(shí)，哥本哈根有關(guān)市政部門為這座旋轉(zhuǎn)樓梯頒發(fā)過(guò)優(yōu)秀設(shè)計(jì)獎(jiǎng)狀。 這張照片有幾個(gè)重要的缺陷。第一，因?yàn)槭嵌自诘厣嫌檬謾C(jī)在距離樓梯很近的地方拍的，所以所有的柱子、欄桿都向中間傾斜。第二，由于地面瓷磚反射頂蓬的燈光，畫(huà)面顯得凌亂。第三，手機(jī)的光學(xué)傳感器像素低，任何后期的余地都比較小。 之前的photoshop 很難解決上述這些問(wèn)題。 圖十一，修圖的第一步，先用 AI 填充功能除去了所有地上的反光。第二步，使用photoshop 原有的整形功能，從左右兩個(gè)方向，將所有歪斜的柱子矯直。 　　經(jīng)過(guò)矯正，柱子是直了，但是又帶來(lái)兩問(wèn)題。一是左右兩邊各自出現(xiàn)了一個(gè)空白的三角地帶。二是圖像的上下發(fā)生嚴(yán)重變形，樓梯變矮了。 對(duì)于這種矯正之后產(chǎn)生的空白，過(guò)去只能用裁切的方法解決，就是切掉左右兩側(cè)。但是這樣一來(lái)，不僅大廳的部分大幅縮減，而且樓梯上方的圓形開(kāi)口也無(wú)法保持完整。 圖十二，第三步，用generative fill這個(gè)新功能填充了左右兩邊的三角形空白區(qū)域。第四步，在上面新產(chǎn)生的圖像基礎(chǔ)上，再一次使用photoshop 原有的局部整形功能，矯正圖十二中的上下變形的畫(huà)面，使其恢復(fù)到可以接受的透視比例。 　　在照片右邊，AI 填充工具擴(kuò)充了大廳的休息區(qū)，靠窗的地方有了一臺(tái)大屏幕電視機(jī)。地面的材料，以及新增加的天花板上的燈也都與原來(lái)大廳里的一致。在照片的左邊，新增加了一道通往另一??房間的門，而且立柱上還加裝了燈飾。 　　做完這些事，再與圖十去比較一下。這樣的酒店是不是給你這位顧客的觀感更好一些？ 生成式填充工具應(yīng)用之三：Flakstad 海灘 圖十三，挪威羅弗墩群?? Flakstad 海灘之晨。本文作者于2023年3月拍攝。 　　今年3月，我們隨云漫的攝影團(tuán)到羅佛頓群島去。一天早上，到一個(gè)鮮為人知的海灣去拍攝一種特別的沙紋。 春天陸地上的雪溶化之后，以千溪萬(wàn)流之勢(shì)，向西北瀉下，匯入挪威海。軟泥和細(xì)沙隨大小不一、方向不一的水流俱下，構(gòu)成了形狀和色彩各異的圖案，造型不僅豐富而且獨(dú)特。我們希望拍攝以這種沙紋為引導(dǎo)線，以 Flakstad 海角為背景的海灘。 　　在對(duì)比單反相機(jī)和手機(jī)的照片之后我們看出，1）手機(jī)的鏡頭（f/1.6）比相機(jī)的（f/2.8）角度更廣。就單張照片來(lái)說(shuō)，手機(jī)照片不僅可以容納直至腳下的前景，還可以有更寬闊的視野，包括左側(cè)水流入海的弧線。這樣一來(lái)，作為前景的泥沙圖案同時(shí)又可作為較為完整的引導(dǎo)線，使畫(huà)面更加生動(dòng)。 但是另一方面，相機(jī)照片的細(xì)節(jié)相對(duì)豐滿，色彩也更豐富一些。所以在畫(huà)質(zhì)上相機(jī)照片是首選。 非常后悔當(dāng)時(shí)沒(méi)有將相機(jī)向左轉(zhuǎn)動(dòng)15～20度，再拍一張照片，然后在后期處理的時(shí)候，把這兩張照片合并成一張。這樣在水平方向的視角就能寬闊許多。 圖十四，運(yùn)用 AI 填充工具在照片的左邊自動(dòng)填充了五分之一的寬度，得到了上面的照片。 　　經(jīng)過(guò) AI 自動(dòng)填充，沙紋自動(dòng)順著水流的走勢(shì)向左前方延伸；遠(yuǎn)處的雲(yún)層和海浪也向左自然延伸； Flakstad 海角被順勢(shì)移到了圖像中間偏右的位置，而不是堵在正當(dāng)中。這樣在視覺(jué)上是不是好了很多？ AI 填充工具尚不完美，人類仍需努力 圖十五，京都二年坂夜色。2022年10月本文作者拍攝。 　　去年秋天一個(gè)傍晚，在前往京都高臺(tái)寺的一個(gè)臺(tái)階上，偶然回頭一望，看到了山坡下面二年坂商業(yè)街華燈初上的一幕。當(dāng)時(shí)使用了中長(zhǎng)焦鏡頭，手持相機(jī)拍攝。不幸的是，一輛汽車打著大燈，停在街口，還有一根粗大的電線桿豎在街當(dāng)中。 根據(jù)過(guò)去的條件，無(wú)法在后期工作中完好地除去那輛車，只好把照片下面裁掉。因此，12x8 英寸的照片就變成 10x8 英寸的照片了。又因?yàn)橐郧?photoshop 的 Fill 工具的功能有限，在抹去電線桿后，產(chǎn)生了許多從電線桿周邊自動(dòng)拷貝來(lái)的元素，例如出現(xiàn)了兩個(gè)一模一樣的男人的腦袋之類，簡(jiǎn)直慘不忍睹。 圖十六，用生成式填充工具修整后的京都二年坂夜色照片。 　　最近，用生成式填充工具重新為這張照片做了后期。這次不再需要進(jìn)行無(wú)奈的裁剪，也不再為抹去照片中的一部分而擔(dān)驚受怕了。 　　終于得到了一張可以接受的照片。 　　但是並非一步到位。一共用了20次這個(gè)工具，而且還經(jīng)常需要與 photoshop 原有的填充工具結(jié)合著使用，一塊一塊圖面地修整。 造成這種情況的原因，主要是作為攝影師，覺(jué)得還是應(yīng)該基本上忠于原作，只希望比較自然地去掉一些障礙物，而不需要 AI 制造出一個(gè)全新的環(huán)境?？磥?lái)達(dá)到這個(gè)要求還比較困難。 事實(shí)是，在圖像上所選擇的區(qū)域越小，選擇區(qū)域周邊的元素越復(fù)雜，AI 實(shí)現(xiàn)完美填充的難度就越大。 比如去掉電線桿，電線桿后面還有被擋住的半個(gè)人，這個(gè)人身后還有人，或者還有旁邊的人的一條胳膊或半條腿。又比如去掉一個(gè)交通指示牌，指示牌原先擋住的地上的光和影就會(huì)顯得怪異，所以還要反復(fù)修改地上的光和影，使得這些地方的磚塊與周邊的磚塊相稱。 圖十七，穩(wěn)定擴(kuò)散模型中的輸出過(guò)程（亦稱“逆向擴(kuò)散”過(guò)程）圖解。取自張熖教授7月22講座：《生成式人工智能及其對(duì)攝影的沖擊》。 　　前面已經(jīng)說(shuō)過(guò)，生成式人工智能的算法很重要。在目前的幾種算法當(dāng)中，穩(wěn)定擴(kuò)散模型在生成圖像方面著有成效。 如圖十七所示，穩(wěn)定擴(kuò)散模型輸出數(shù)據(jù)的過(guò)程分為下達(dá)指令，讀取文字指令，產(chǎn)生圖像幾個(gè)環(huán)節(jié)。如何才能做到人機(jī)完美的相互理解，以及如何讓 AI 系統(tǒng)能夠產(chǎn)生出更像人類對(duì)自然場(chǎng)景的視覺(jué)感受那樣的圖像來(lái)，是兩個(gè)期待進(jìn)一步優(yōu)化的地方。 圖十八，闖蕩在塞倫蓋蒂草原的荒野上。2016年9月本文作者拍攝于坦桑尼亞。 　　與 AI 共舞，無(wú)異于與狼共舞。把一個(gè)非人類的物種一步一步地養(yǎng)大，馴化它，與它心靈相通，讓它成為人類的助手。 AI 工具尚不完美，人類仍需努力！ ………………………… R&R Studio致?于紀(jì)實(shí)攝影和?學(xué)創(chuàng)作。風(fēng)光和野?動(dòng)物攝影；地?、城市、?物的歷史和傳記。?清新的畫(huà)?傳遞?然的魅?；以簡(jiǎn)練的風(fēng)格揭??物及社會(huì)的軌跡。

亚拍区欧拍区自拍区|日本强奸久久天堂色网站|午夜羞羞福利视频|你懂得福利影院|国产超级Avav无码成人|超碰免费人人成人色综合|欧美岛国一二三区|黄片欧美亚洲第一|人妻精品免费成人片在线|免费黄色片不日本

與 AI 共舞

Raymond Li