當前位置: 華文星空 > 寵物

如何評價2023年泰迪杯C題?

2023-03-30寵物

更新時間:2023-4-13 釋出問題三

在這裏插入圖片描述

相關連結

【2023年第十一屆泰迪杯資料探勘挑戰賽】C題泰迪內推平台招聘與求職雙向推薦系統構建 建模及python程式碼詳解 問題一

【2023年第十一屆泰迪杯資料探勘挑戰賽】C題泰迪內推平台招聘與求職雙向推薦系統構建 建模及python程式碼詳解 問題二

【2023年第十一屆泰迪杯資料探勘挑戰賽】C題泰迪內推平台招聘與求職雙向推薦系統構建 建模及python程式碼詳解 問題三

【2023年第十一屆泰迪杯資料探勘挑戰賽】C題泰迪內推平台招聘與求職雙向推薦系統構建 建模及python程式碼詳解 問題四

1 題目

一、問題背景

在新時代背景下,隨著大學生畢業人數不斷增加,大學生求職問題已成為廣泛關註的社 會熱點。而且受疫情影響,諸多企業的招聘都改為線上進行,脫離時間和空間的限制,招聘 需求不斷上漲,有近六成企業招聘需求增加,其中需求量較大的科技研發、數碼化、藍領技 能崗位都存在不同程度的人才短缺。但從人才供給來看,應屆生數量增加,2022 年高校畢 業生達到創紀錄的 1076 萬人,而且部份企業校招開展暫緩或推遲,因此出現校招需求縮減 或凍結,這些因素都加劇了應屆生就業的嚴峻形勢。基於種種因素,出現就業競爭壓力大、 招聘與求職資訊不對稱等現象。

泰迪內推平台是聚焦於「大數據+」和「人工智能「領域的求職招聘網站,該平台融合了多家企業釋出的招聘資訊,同時平台也為求職者提供求職資訊的展示。為緩解畢業生就業 壓力,同時滿足企業對人才的需求,泰迪內推平台會定期為高校學生提供優質崗位推薦,解 決畢業生就業的同時也緩解企業用人難的問題,為校企之間搭建起資源互換的橋梁,力求實 現人才的供需對接和教育資源轉化,透過深化產教融合,促進教育鏈、人才鏈、產業鏈與創 新鏈有機銜接。

因此,對招聘資訊進行分析研究,了解不同職業領域的需求特點,挖掘興起的數據類行 業相應的人才需求現狀及發展趨勢,為廣大求職者提供正確的就業指導有著重要意義。

二、解決問題

1.招聘資訊爬取

從泰迪內推平台(https://www. 5iai.com/# /index )的「找工作「頁面和「找人才」頁面,爬取所有招聘與求職資訊並整理,依據招聘資訊ID記錄每條招聘資訊並保存為「result1 - 1.csv」檔,求職資訊則依據求職者ID記錄並保存為「result1-2.csv」檔,涉及的招聘資訊ID和求職者ID均來自網址路徑後端的數碼串,如圖1所示。(樣版檔見附件1中的CSV檔)

在這裏插入圖片描述

1 某招聘資訊網頁

2.招聘與求職資訊分析

套用問題 1 的招聘資訊與求職資訊構建畫像:根據采集的企業招聘資訊,從招聘崗位、 學歷要求、崗位需求量、公司類別、薪資待遇、崗位技能、企業工作地點等多個方向建立招 聘資訊畫像;根據采集求職者求職資訊,從預期崗位、薪資需求、知識儲備、學歷、工作經 驗等多個方向建立求職者畫像。

3.構建崗位匹配度和求職者滿意度的模型

在招聘和求職過程中,企業面對多位優質求職者,將會考慮求職者能力要求、技能掌握 等多方面,崗位匹配度是體現求職者滿足企業招聘要求的匹配程度;同樣,求職者對於多種 招聘資訊,也會依據自身條件和要求,選取符合自己心意的崗位,因此求職者滿意度指標可 客觀體現求職者對企業招聘崗位的滿意程度。對於不滿足崗位最低要求的求職者,企業可定 義其崗位匹配度為 0。同樣,對於不滿足求職者最低要求的崗位,求職者可定義其求職者滿 意度為 0。

根據問題2的招聘資訊與求職者資訊,構建崗位匹配度和求職者滿意度的模型,基於該模型,為每條招聘資訊提供崗位匹配度非0的求職者,將結果進行降序排序存放在「resul3 - 1. csv」檔中,以及為每位求職者提供求職者滿意度非0的招聘資訊,將結果進行降序排序存放在「result3 - 2. csv」檔中。(樣版檔見附件1中的CSV檔)

4.招聘求職雙向推薦模型

假設招聘流程如下:設某崗位擬聘人,泰迪內推平台向企業推薦崗位匹配度非0的n位求職者發出第一圈報價,求職者如果收到多於1個崗位的報價,則求職者選取滿意度最高的崗位簽約,每個求職者只允許選擇1個崗位簽了約。第一圈結束後,平台根據當前各招聘資訊的剩余崗位數,向後續被推薦求職者發出第二輪報價,如此繼續,直到招聘人數已滿或者向所有擬推薦求職者均已發出提供為止。

在上述招聘流程中,由於條件優秀的崗位求職者都願意去,而條件優秀的求職者各崗位 都願意錄用,很難做到履約率達到百分之百,因此履約率高低是評價平台的推薦系統優劣的 重要指標。這裏的履約率定義為:

履約率=所有崗位的簽約人數之和/所有擬聘崗位人數之和

請為平台設計招聘求職雙向推薦模型,使得履約率指標達到最高。並將招聘崗位與求職者簽約成功的結果存放在「resul4.csv」檔中。

三、附件說明

附件1是問題1,問題3和問題4的樣版檔,檔均為csv檔,采用ANSI編碼。Result1-1.csv:從泰迪內推平台爬取的招聘資訊,檔參考表1格式。

在這裏插入圖片描述

Result1-2.csv:從泰迪內推平台爬取的求職資訊,檔參考表2格式。表 2 result1-2.csv樣 例.

在這裏插入圖片描述

result3 - 1. - csv:該文件儲存每條招聘資訊中崗位匹配度非0的求職者,需將結果進行降序排序,具體欄位名和樣例見表3。

在這裏插入圖片描述

result3 - 2. - csv:該文件儲存每位求職者滿意度非0的招聘資訊,需將結果進行降序排序,具體欄位名和樣例見表4。

在這裏插入圖片描述

result4.csv:根據履約率最高的模型,提供招聘崗位簽約成功後的求職者ID。該結果需對招聘資訊ID進行排序,並對每個招聘資訊的數據按崗位匹配度降序排序,具體欄位名和樣例見表5。

在這裏插入圖片描述

2 問題一思路分析及python程式碼實作

3 問題二思路分析及python程式碼實作

4 問題三思路分析及python程式碼實作

5 問題四思路分析及python程式碼實作

待更新。。