第一部份:Crowdflower Search Results Relevance
案例介紹:預測來自電子商務站點的搜索結果的準確性,將搜索得到的網頁按相關性排序
獲獎者所用方法:通過ensemble learning整合多個模型的結果
涉及算法:Ensemble learning
第二部份:Santander Product Recommendation
案例介紹:根據銀行客戶1.5年內的行為數據,預測用戶會下一步會投資的新產品
獲獎者所用方法:通過XGBoost構建了多個基本模型,然后將基本模型整合為一個總模型
涉及算法:XGBoost
第三部份:TalkingData Mobile User Demographics
案例介紹:根據用戶的手機應用下載和使用行為來預測用戶的人口統計數據(年齡、性別等)
獲獎者所用方法: 先預測性別的概率;使用性別的預測值作為額外的特征加入到模型中,預測年齡;通過條件概率得到兩個目標變量的預測概率
涉及算法:兩段預測,XGBoost
第四部份:Facebook V: Predicting Check Ins
案例介紹:預測用戶會在哪個地方登陸Facebook
獲獎者所用方法:特征選擇:數據塊的近鄰計算;模型構建:基于XGBoost的兩步模型
涉及算法:XGboost
第五部份:Avito Duplicate Ads Detection
案例介紹:為了避免賣家發布各種經過少量改動的廣告導致買家難以分辨,參賽者需要設計一個模型,自動識別配對中的廣告是否同一個廣告
獲獎者所用方法:特征選擇:采用了FTIM方法測試特征的不穩定性,提出過度擬合的特征。通過XGBoost和Keras構建一層模型;然后通過底層模型構建XGBoost 和隨機森林,終綜合兩者結果得到終結果
涉及算法:FTIM;元模型
第六部份:Outbrain Click Prediction
案例介紹:在一組針對用戶推薦內容中,預測用戶點擊每個鏈接的可能,將這些推薦內容按照點擊可能的大小排序
獲獎者所用方法:兩步元模型:通過LibFFM構建第一層模型,再使用XGBoost和Keras構建第二層模型
涉及算法:LibFFM;XGBoost;Keras框架
第七部份:Click-Through Rate Prediction
案例介紹:預測某個廣告是否會被點擊
獲獎者所用方法:將數據拆分成不同的子集,構建不同的子模型,再整合
涉及算法:LIBFFM
第八部份:Avito Context Ad Clicks
案例介紹:預測俄羅斯較大的一般分類網站的用戶在瀏覽網站時,是否點擊上下文廣告
獲獎者所用方法:預處理:散列技巧和消極的抽樣。 學習方法:FFM、FM和XGBoost。
涉及算法:FFM;FM;XGboost
第九部份:Rossmann Store Sales
案例介紹:預測Rossmann公司各個門店的6周銷售量
獲獎者所用方法:分類特征的處理:創建了一種 Entity Embedding(實體嵌入)的方法去代表在多維空間中的分類特征。
涉及算法:Entity Embedding;神經網絡
第十部份:Amazon.com - Employee Access Challenge
案例介紹:根據員工的職業角色,預測員工的訪問需求
獲獎者所用方法:11個模型的線性組合:使用不同特征訓練的GBM模型,GLNNET模型,隨機森林模型,logistic回歸模型
涉及算法:GBM模型,GLNNET模型,隨機森林模型,logistic回歸模型
|