這篇文章因為是此行重點,所以會花點篇幅介紹資工相關技術。不想看的可以跳過。
一早就前往TOSHIBA的研發中心進行參訪行程,這次能進入日本企業進行參訪真的很幸運,因為平常不管哪個學校,想進企業參訪根本就是不可能的事,但剛好早稻田的榮譽教授「平沢教授」上學期有到我們系上進行演講,他得知我們這次要去早稻田進行參訪,就通知他已畢業的學生跟合作企業希望能讓我們參訪,也因此我們得已進去平常只有國際企業要進行技術交流才能進入的機密重地。
TOSHIBA準備的很齊全,給了我們一本最近研發技術的手冊,再搭配簡單的介紹影片,之後就有專人領隊帶我們到各研究室聽取講解以及看DEMO實況。
在此分為兩個梯次,一個使用英文講解,系主任領隊,技術人員使用英文進行講解。另一個是使用日文講解,由某日語很強的教授(主任老婆?)領隊,同一批技術人員使用日文講解。兩批先後前往不同的實驗室,大致就是這樣的流程。
由於我的日(英)文(文)不(很)錯(爛),所以當然是跟著日文講解的梯次進行參觀,進到程式實驗大樓才發現這裡有多機密,每間實驗室都需要人臉辨識,還有很多道門都需要個人ID卡才能通過,這次主要的介紹有幾個重點:「圖像自我畫質提升」、「影片動態清晰化」、「即時語言翻譯機」、「人臉辨識」。
日文介紹這邊由於師母(?)的專業用語也不是很懂,這些部分大都是由我進行翻譯,所以大家也都算還有辦法進行適當程度的交流。
先講解「圖像自我畫質提升」,以前多媒體概論有教過若是需要提升畫面穩定度,在傳輸影片時,需要連前幾張FRAME以及後面幾張FRAME也一併傳過去,然後系統會判斷哪邊比較需要進行畫面的更新,在對此部分進行編碼,但這次的新技術卻是「只需要一張圖片就可以進行自我畫質提升」,做法其實不難,在圖片中抓取希望提升畫質的BLOCK,然後根據這個BLOCK的像素尋找周圍是否有很類似的BLOCK色塊,這樣可以推測兩者是類似的材質或是圖案,就可以將兩個BLOCK的特徵進行混合,這樣產生出的新特徵會更接近真實的特徵,最後輸出就是成果圖像,還有一個重點就是他們取樣的BLOCK大小是3*3的大小。DEMO出來的成果的確令人驚艷!!
第二個是「影片動態清晰化」,在高畫質影片中,如果需要進行快速的畫面切換,由於每一張圖都很清晰,所以反而會突顯出快速切換的馬賽克缺陷。但利用一些機制放在原本的流程圖中就可以將模糊現像去除掉,共使用三種技術,最容易講解的其中一種就是觀測圖像中的色塊,若是很大一片都是相同顏色,可猜測這片圖像有很大機率在下一個FRAME不會有動作,這樣就可以省去這邊的資源去協助其他去快進行編碼,另外兩個技術就比較複雜,但他們也很熱心的分享部分演算法給我們,令我們學到不少。
第三「即時語言翻譯機」,寒假時有注意到台灣新聞的人就可以知道,那時就有公司在東京鐵塔進行這部翻譯機的實用性,當我提出這個疑問時,他們的主管還很驚訝我竟然有注意到他們在進行實地測試的情況,這應該對我們系上有些幫助吧(笑),新聞中的產品就是東芝的研究成果,然後也很熱心的分享完整的演算法給我們,對研究自然語言的人應該超有幫助的吧。他也實際DEMO給我們看,全場真的是一片讚嘆,新聞沒有騙人!!真的可以直接講話然後馬上在5秒內翻譯成其他語言,目前可以使用的就是英日中三國語言的互換,而且準確率極高,當我們很興奮的問他們是否快要量產時,研究人員笑笑的回答「快了快了,希望程序能趕快通過就能上市了」,看來要在2012年前看到實品上市的機會很大,大家可以期待一下囉。
最後就是「人臉辨識」,也是大概講解了大致技術,由於在他們實驗室中已經到處都在實用了,所以這可說是他們很驕傲的一項研究成果,登錄馬上就可以使用,非常方便。而且他是做3D的人臉特徵辨識的方法,可以避免拿圖像欺騙的方法,也能避免臉部輪廓不清晰造成的誤判,可說是很聰明的方法,實際的DEMO準確率也是百分百,還會一併找出相似的臉孔以供確認,很實用的技術。
結論TOSHIBA真的要大推。
即使是面對我們這些學生也絲毫不藏技術。
不過主任那邊就比較沒有這麼幸運了,第一是因為主任用英文交談,沒有學生會日文,講解人員英文又很破,導致了常常是雞同鴨講,第二又因為可能是主任會擔心商業機密他們會不回答,所以幾乎都只有看DEMO情況跟大致介紹,有問題的地方也沒有提出太深入的疑問,所以聽那批的學長姐說沒聽到太多的細節,我們這邊除了非資工本業的教授外通通都是學生,而且又能用日語溝通,所以常常不怕死的問了很多程式問題,但他們也都很大方的跟我們講,還會跟我們討論,可見他們的氣度,東芝大推阿!!
另外的三菱就算了...
他們其實算是中下游廠商,大都是向研究室買技術,然後再開發相關應用而已,不過要提的一點還是很值得注意,就是「嶄新的編碼方式」。
有上過資通跟無網的人應該知道,現在正是第三代CDMA邁向第四代OFDMA的時候。但這不是重點,真正厲害的是光纖傳輸中還能進行資料的隱藏編碼,這邊主任一樣不敢問的太深入,我是在結尾Q&A實才提出來問研發人員說「光纖編碼的做法是利用CDMA類似的技術嗎?」,他們技術人員才大致講解了一下,就是跟CDMA一樣是塞入KEY進入明文中進行編碼,只是他塞入的對象是光,這點就是他們的技術力所在,這時主任才很興奮的問我說「是跟CDMA很像吧,是嗎?」看來主任其實很在意嘛XDDDD
三菱比較可取的先進之處應該就是在編碼吧,其餘的應用就看看就好了。
以上就是企業參訪的大概情況。
以上只是部分重要的圖,突然發現這網路空間真爛,上傳空間給這麼少,所以對其餘有興趣再連絡我吧。
沒有留言:
張貼留言