綠色排版工具|熱門專題|網站地圖|移動官網|微信編輯器
您的當前位置:網站首頁 > 網站分析 > 數據可視化 > 正文

搭建一套完整的推薦系統的流程

來源:未知 編輯:小螞蟻 時間:2019-08-21 02:12:14 閱讀:

  企業推薦系統實踐與思考:推薦系統,應該自建還是選擇第三方。

http://www.yqejgy.live/

  (1)適合自建的企業及自建風險對于同時符臺大型公司、技術積累諒厚、戰略縱深類因素的公司適合自建。相比中小型公司,大型公司擁有足夠資源、時間.人力儲備來滿足自建需求。大型公司有深厚的技術積累,且有足夠的現金牛業務,不迫切麗要增長,則可以自建。但是自建會面臨較高的招聘成本·時間風險、效果風險。 本文來自小螞蟻站長吧

  (2)引用第三方廠商的好處及風險引入第三方產品相比自建的確是投資低、見效快,但是會面臨企業推薦系統能力沉淀,以及系統能否與業務相融合的風險。

http://www.yqejgy.live/

  企業是自建還是選擇第三方,需要綜合衡量后做決定。如果企業綜合衡量后,選擇讓專業的廠商做專業的事,那么應該選擇最符合自身業務需求的廠商,而非最便宜的價格,從而將主要精力聚焦在自身核心業務上。 http://www.yqejgy.live/

  推薦系統目的之一是要建立人與物以及物物之間的關系。通常,推薦系統的搭建流程分為幾步。 內容來自小螞蟻站長吧

  (1)第一步:確定業務場景。

  企業要根據產品形態·現有數據、業務目標、產品運營方向來確定你做推薦所需差的數據源。這些數據源包括: 本文來自小螞蟻站長吧

  A、要推薦物品或內容的元數據,例如ID、關鍵宇、描述等:

內容來自小螞蟻站長吧

  B、系統用戶的基本信息,傍0如I隊性別、年齡等: 本文來自小螞蟻站長吧

  用戶稍要唯一識別的ID,推薦系統有一個難點是Web端的統一用戶識別,因為在手機端可以相對容易的來確定用戶l阢但在Web端,由于存在瀏覽囂等各種差異,會導致用戶ID差異。在此基礎上,如果有性別、年齡等信息,那么用戶畫像會更加清晰,更方便做個性化推薦。 內容來自小螞蟻站長吧

  C.用戶對物品或者信息的偏好,包括顯式的用戶反饋、隱式的用戶反饋、負反饋。顯式的用戶反饋例如用戶對物品的評分,或者對物品的評論;隱式的用戶反饋,例如用戶購買了某物品,用戶查看了菜物品的信息等。負反饋,例如用戶點擊“不喜歡”,或展現了物品信息但是用戶沒有點擊。 http://www.yqejgy.live/

  負反饋是大家容易忽略aj,在機器學習系統里面如果只有正例,沒有負倒是不能工作的。那應該如何采集負例?比如用戶點擊了一個叫“我不喜歡“的按鈕,這是用戶的負反饋。這種負反饋的缺點往往是量級不夠大,所以為了保證負反饋的足夠量級,神策通常采集負反饋的方式之一是,當展示十個物品時,用戶點了第三個,可能因為不太喜歡第一、第二個物品,因而沒有點擊,那么前兩個物品就是用戶的負反饋,第三個商品就是用戶的正反饋。 本文來自小螞蟻站長吧

  D、訪問時的上下文信息,例如時間、請求頁面的其他信息等。

內容來自小螞蟻站長吧

  比如,用戶在公交車上與躺床上看的視頻可6&是不—樣的,導致差異的因素可能是時間,也可能是網絡琦:境等:家里的電視,雖然是同一個ID,但是爸爸、媽媽、核子觀看的內容差異很大,如何在這種情況下做推薦?神策會嘗試引入時間維度,因為小朋友看電視的時間比較固定,媽媽看連續劇的時間也相對固定,引入時間維度在一定程度上能緩解這件事情。 內容來自小螞蟻站長吧

  (2)第二步:建立評價體系。

  建立推薦系統之前,耍想好如何進行評估。評價體系的方法包括離線評估和在線評估兩種方式,做詳細介紹,這里不再敖述。

http://www.yqejgy.live/

  耍進行科學的評估,企業應該重點注意以下幾個問翹: copyright 小螞蟻站長吧

  第一,通過A/B Test進行評估;值得強調的是,A/B Test分組的用戶應該是正交的,如果分組是安卓渠道和ios渠道,那這兩組用戶本身的行為就會存在偏差,因為兩個渠道是有各自的特點的,這樣做并不是科學的方式。 copyright 小螞蟻站長吧

  第二,使用對比指標而不是絕對值指標;如果你關注CTR指標,追求的目標并非將目標達到5%就OK,我們關注的指標應該是相對值,也就是對比基線策略提升了多少。因為絕對值會被產品形態和具體業務場景影響,比如產品首頁上只有這一個按鈕則能夠產生較高的點擊率。也就是說,在所有因子不變的情況下,只修改策略和方法后的對比指標才有意義。

http://www.yqejgy.live/

  第三,不管是機器學習還是推薦系統,追求的都是整體效果提升,而無法具體到優化個體效果。對個人優化時,我們通常一般只會處理那些Bad Case。

copyright 小螞蟻站長吧

  (3)第三步:數據采集和模型。

  這個過程包括特征選取、數據清洗、特征工程、正倒與負例。 http://www.yqejgy.live/

  (4)第四步:模型訓練和工程化。

  這個過程包括數據流建立、訓練和優化模型、推薦眼務(5)第五步:實驗與迭代綜上所述,推薦系統是一個流程:海量item-候選集合一排序列表—推薦結果。 本文來自小螞蟻站長吧

搭建一套完整的推薦系統的流程 copyright 小螞蟻站長吧

  在推薦系統中,海置物品組成的可推薦池子中,對所有的數據進行一定的處理,才能保證在百毫秒內召回需耍推薦的物品,并對物品進行排序,按照排序列表進行推薦,這個還需耍配合非常多的工程上的方法。 本文來自小螞蟻站長吧

圖文精選:

Copyright?2012-2030小螞蟻信息網版權所有 站長QQ:1614558876 粵ICP備14061018號-1


鄭重聲明:本網站資源、信息來源于網絡,完全免費共享,僅供學習和研究使用,版權和著作權歸原作者所有,如有不愿意被轉載的情況,請通知我們QQ1614558876刪除已轉載的信息。

Top 彩票开奖12选5辽宁省