在 eBay Korea,物流中心的高效運營和自動化、基于消費行為模式的消費者傾向估計、銷售產(chǎn)品和廣告產(chǎn)品之間的相關(guān)性增加以及異常交易的檢測等。
eBay Korea 正在廣泛的領(lǐng)域使用人工智能 (AI),例如物流中心的高效運營和自動化、基于消費行為模式的消費者傾向估計、增加銷售產(chǎn)品和廣告產(chǎn)品之間的相關(guān)性以及檢測異常交易.
近日,eBay韓國AI團隊經(jīng)理Sang-Hoon Kim在短短一年內(nèi)被谷歌旗下全球最大在線AI競賽平臺“Kaggle”評選為頂級研究員(Grand Master)。
讓我們與經(jīng)理 Sang-Hoon Kim 見面,聽聽有關(guān)比賽準備過程和最近 AI 趨勢的各種故事!
10 年前,我對機器學習很感興趣……參與各種研發(fā)
你好。我叫 Sang-Hoon Kim,在 eBay 韓國 AI 實驗室的 AI 平臺團隊工作。我主修電氣工程,10 年前,我在讀研究生時就開始專注于機器學習的研究。計算機視覺領(lǐng)域的人臉識別是一個研究課題,但在公司工作期間,我對自然語言處理等其他領(lǐng)域產(chǎn)生了興趣。在 eBay Korea 之前的公司中,他還是一名數(shù)據(jù)科學家,他使用深度學習技術(shù)和時尚單品推薦技術(shù)開發(fā)了機器翻譯器(如谷歌翻譯器),以尋找匹配的衣服。
有些人混淆了數(shù)據(jù)科學和機器學習之間的關(guān)系。如果你認為,“在數(shù)據(jù)科學家使用的各種工具中,機器學習是最常用的”,它會更容易理解。
參加Kaggle學習結(jié)構(gòu)化數(shù)據(jù),非專業(yè)
Kaggle 是谷歌旗下全球最受歡迎的在線人工智能 (AI) 競賽平臺。我知道目前有來自 194 個國家的超過 100 萬人參加。通過在 Kaggle 平臺上注冊世界各地的公司和機構(gòu)想要解決的任務(wù)和數(shù)據(jù)來舉辦競賽。平均每年舉辦 30 場比賽,當比賽開始時,來自世界各地的數(shù)據(jù)科學家將在比賽中競爭,以找出解決問題的方法。
從我第一次來到 eBay Korea 開始,我就在一定程度上了解了機器學習中處理圖像和文本等非結(jié)構(gòu)化數(shù)據(jù)的技術(shù)。但是,我不熟悉處理結(jié)構(gòu)化數(shù)據(jù)的技術(shù),結(jié)構(gòu)化數(shù)據(jù)指的是可以制表的數(shù)據(jù)。同時在Kaggle里面有很多處理結(jié)構(gòu)化數(shù)據(jù)的比賽,所以我加入了Kaggle來學習處理結(jié)構(gòu)化數(shù)據(jù)的技巧。
攔截惡意評論、開發(fā)教育類APP、診斷疑難雜癥、研發(fā)新藥、預(yù)測氣候等……人工智能應(yīng)用層出不窮
Kaggle 引入了等級(等級)系統(tǒng)和排名系統(tǒng)來激勵參賽者。這樣做是為了讓參與者不僅可以獲得獎金,還可以獲得榮譽。等級由獲得的獎牌種類和數(shù)量決定,名次由每場比賽獲得的總積分決定(排名越高,積分越多)。
首先看段位,金、銀、銅牌是根據(jù)比賽的名次分給的,在1000多支隊伍參加的比賽中進入前10就可以獲得金牌,前5%可以拿到銀牌,前10%可以拿銅牌。根據(jù)獲得的獎牌類型和數(shù)量,等級按照初學者→專家→大師→大師的順序上升。
成為宗師的條件是獲得5枚金牌。所以你必須在至少 5 場比賽中贏得金牌。但是,有一個特別棘手的條件:5 枚金牌中的 1 枚必須通過單人比賽獲得……這是一個非常困難的條件,因為您必須與 2-5 人的團隊單獨競爭。所以,多年來成為高手的人也不少。對于那些想挑戰(zhàn) Kaggle 的人,這里有一些我贏得金牌的比賽。
在由 Google 的 Jigsaw/Conversation AI 組織主辦的一場比賽中,他們角逐了判斷評論是否惡意的能力。最近,我們使用了自然語言處理領(lǐng)域著名的深度學習模型 BERT、GPT2、XLNET 等,并設(shè)計了多任務(wù)學習(一種以各種方式設(shè)定學習目標的方法),在 3,165 個中排名第 2團隊。
美國博思艾倫漢密爾頓公司還舉辦了一場結(jié)構(gòu)化數(shù)據(jù)競賽。孩子們測量!有一個名為 的教育應(yīng)用程序,這是一項通過查看使用此應(yīng)用程序的孩子的過去歷史來預(yù)測孩子未來成就的競賽。結(jié)構(gòu)化數(shù)據(jù)比賽通常使用基于樹的技術(shù),但我在這次比賽中應(yīng)用了一種稱為 TRANSFORMER 的技術(shù),用于自然語言處理,并在 3,497 支隊伍中獲得了第三名。
我還記得澳大利亞一個名為 APTOS(亞太遠程眼科協(xié)會)的協(xié)會組織的比賽。開發(fā)一種機器學習技術(shù)可以快速診斷一種稱為糖尿病視網(wǎng)膜病變的疾病,這種疾病占失明原因的很大比例,這一主題是新穎的。此外,深度學習技術(shù)被應(yīng)用于在衛(wèi)星拍攝的云圖像中尋找特定形狀用于氣候研究,或競爭該技術(shù)以預(yù)測廣泛用于候選藥物研究的化合物的數(shù)量,并通過機器學習模型。這樣看來,人工智能應(yīng)用的領(lǐng)域似乎是非常多樣化的。
目前,全球有180位大師,韓國有3位。
對我來說最大的動力是這個競爭系統(tǒng)。即使我達到第 50 位,我的個人資料排名也開始出現(xiàn)在公告板上。然后,從你看到它的那一刻起,你就會更加努力。因為當我的成績下降時我的心很痛... (呵呵)所以我覺得我本來不是很專注的風格,但是當我比賽的時候,我變得更加專注了。我只看到分數(shù)下降...當然,公司努力工作,做得很好…… . (哈哈)
免費易趣韓國文化...對開發(fā)開發(fā)能力有很大幫助
在熟人的推薦下,我在大約 1 年零 6 個月前加入了 eBay Korea。在我供職的 AI 團隊中,有來自不同背景的開發(fā)者,主要在電商、金融機構(gòu)、大公司經(jīng)歷過機器學習。我主要致力于糾正與產(chǎn)品不匹配的類別的類別推薦技術(shù),以及有助于提前檢測和防止客戶流失的客戶流失預(yù)測技術(shù)的開發(fā)。
eBay韓國的橫向企業(yè)文化對提高開發(fā)能力有很大幫助。您可以自由表達與工作相關(guān)的意見并產(chǎn)生新想法的氛圍似乎創(chuàng)造了一個您可以更加專注于發(fā)展的環(huán)境。有彈性工作制,可以自由調(diào)整通勤時間,必要時還實行遠程辦公。
今年,對于那些想在工作中使用機器學習,但因為沒有合適的指導而有困難的人,我們會將我們團隊創(chuàng)建的AI服務(wù)作為API提供給其他部門的人。公司可以輕松使用它。
國內(nèi)AI市場一定有大量投資,所以商業(yè)領(lǐng)域的使用會增加
從韓國人工智能相關(guān)論文數(shù)量或相關(guān)公司數(shù)量來看,似乎很難說韓國在人工智能領(lǐng)域處于領(lǐng)先地位。我認為這在 Kaggle 中也可以看到。日本大約有 10 名 Kaggle 大師,中國有 30 名,美國大約有 30 名,但在韓國,只有大約 3 名。有傳言稱 Kaggle 是各國 AI 競爭力的指標,如果韓國能支持更積極的投資就好了。
相信未來人工智能會在電商領(lǐng)域得到更廣泛的應(yīng)用。一個典型的例子是對各種產(chǎn)品的“需求預(yù)測”。近日,Kaggle 舉辦了一場與沃爾瑪銷售預(yù)測相關(guān)的競賽,由于電商數(shù)據(jù)的性質(zhì),很難預(yù)測需求。如果未來開發(fā)出更復(fù)雜的預(yù)測模型,我認為電子商務(wù)行業(yè)將通過銷售預(yù)測對物流/庫存管理有很大幫助。
初級開發(fā)者...愿你發(fā)展的不僅是你的開發(fā)能力,還有你對業(yè)務(wù)的理解!
作為一名數(shù)據(jù)科學家,為數(shù)據(jù)建模和概念驗證 (POC) 開發(fā)客戶的能力,這是他們獨特的工作,當然很重要,但我認為努力提高對業(yè)務(wù)的整體理解也很重要。在公司層面開展項目似乎需要與其他部門的合作和有說服力的溝通技巧。
今后我會繼續(xù)努力為eBay韓國的AI技術(shù)的發(fā)展做出貢獻。明年,我還計劃寫一本書,講述我在 Kaggle 與在我之前成為 Kaggle 大師的人的經(jīng)歷。希望我的小經(jīng)驗對以后想挑戰(zhàn)Kaggle或者AI的人有所幫助。
特別聲明:以上文章內(nèi)容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與ESG跨境電商聯(lián)系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯(lián)系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部