Setina's Blog

人才发展

AI驱动的人才供应链:从精准检索到智能洞察

发表时间:2025-10-03 19:01

当业务说AI找人,到底是找什么

我发现很多业务同事分不清AI检索和AI推荐的差异,在产品设计的过程中陷入到准确度和信息泛化到纠结中,一会儿想搜索结果准确一个人都不能少,一会儿想搜索结果有惊喜有模糊检索。对于这个问题自己做了些功课,今天想聊聊AI HR项目过程中的技术理论与实践困境。

辨别“寻找”与“发现”的本质差异

要说清楚这个事情,需要先搞清AI检索和AI推荐有什么区别。
维度AI检索AI推荐
核心目标精确、高效地找到与用户查询最匹配的有限结果。主动发现并呈现用户可能感兴趣但未明确请求的内容。
用户意图用户有具体需求,主动查询。用户意图不明确,需要泛化结果,提供潜在的兴趣,追求惊喜和粘性。
驱动方式用户驱动。系统驱动。
关键技术理解查询意图、语义搜索、向量相似度计算、相关性排序。用户画像建模、协同过滤、内容分析、上下文感知、强化学习。
评估标准相关性、召回率、准确率。用户满意度、点击率、停留时长、转化率。
结果特性确定性强。个性化强。
典型应用搜索引擎,知识库问答。信息推荐,猜你喜欢。

关键联系与融合

两者边界正在模糊并深度融合,提供一个检索与推荐并存的混合系统:目前市面上绝大多数产品同时提供两种服务。比如:
产品名称类型用户意图AI检索功能AI推荐功能
抖音/淘宝强推荐主导型娱乐为主-〉模糊探索明确寻找特定内容或商品。首页基于用户兴趣持续、主动地推荐内容/商品
智联招聘/猎聘/LinkedIn强搜索主导型需求驱动-〉目标导向企业发布职位,求职者搜索。AI根据岗位自动匹配并推荐候选人,主动执行邀约。
这里可以发现,混合平台还是会有自己的功能偏向性,即使是同类型的产品(比如:抖音和淘宝)都是强推荐主导平台,但在产品设计上能感受到明显的不同。显然,即使是同类型的AI推荐产品,主推的功能点、产品设计、技术实现路径也各不相同。但是为什么会有这样的不同呢?

支撑产品差异背后的技术逻辑

数据形态决定了技术路径,技术选择服务于业务目标。

抖音
淘宝
猎聘
智联招聘
linkedin
目标
留住用户,强调用户粘性和总转化
下单完成交易,强调用户粘性和总转化
追求高精度、低次数的匹配(为一个岗位找到几个最合适的人),强调匹配的准确性和说服力
追求高精度、低次数的匹配(为一个岗位找到几个最合适的人),强调匹配的准确性和说服力
提升平台活跃度、用户粘性和高端会员订阅。
数据类型
海量、非结构化(视频/图片)、用户行为数据极其丰富。
海量、非结构化(视频/图片)、用户行为数据极其丰富。
结构化数据为主
目标人群为聚焦中高端人才,所以数据深度 >数据 广度
动态数据图谱追踪职业变化
结构化数据为主
目标覆盖人群广泛(蓝领到白领),所以数据广度 > 数据深度
海量简历和职位,但单个profile较浅
结构化数据+职业社交图谱数据
产品设计
系统主导,生成一个个性化的、无限的内容流,预测一个特定用户对一个特定内容的即时互动概率(观看时长、点赞、评论等)
监督学习
  • “猜你喜欢” 的商品排序

  • 搜索结果的个性化排序

无监督学习
  • 用户细分/聚类

  • 商品品类自动划分

强化学习
AI(智能体)尝试不同的推荐策略(动作),根据用户是否购买(奖励)来学习。动态调整首页各推荐栏位的策略
大语言模型:
  • 理解自然语言搜索(“适合海边度假的裙子”)

  • 生成商品摘要/卖点

深度 > 广度
动态数据图谱追踪职业变化
传统检索 + 简单匹配 + LLM增强
将复杂的招聘流程(需求分析-寻源-沟通-初筛-风控)模块化,每个环节由一个专门的AI Agent负责,这是应对复杂、标准化长流程的最高效架构。
  • 需求分析agent:分析HR的真实需求(可能没说出来的)

  • 寻源agent:不仅看简历,还看你的人脉关系

  • 可信度评估agent:你的技能是否被大佬背书

范式
监督学习
监督学习 x 无监督学习 x 强化学习 x 大语言模型
AI agent
AI agent
AI agent
实现细节
  • 输入(X):用户特征(画像、历史行为序列) + 内容特征(视频标签、音乐、创作者)。

  • 输出(Y):一个预测分数,代表用户对此内容产生正反馈的概率。

  • 训练过程:
    • 收集海量训练数据:数亿个 (用户, 内容, 实际反馈) 三元组。

    • 模型学习:一个深度神经网络试图找到从X到Y的复杂映射函数。它会不断调整内部参数,使得预测的反馈概率尽可能接近实际反馈。

    • 目标函数:通常是“最大化用户总观看时长”或“提高互动率”。这决定了模型的价值观——它被训练成什么样子。

监督学习
  猜你喜欢”的个性化排序
  • 输入:用户画像、历史行为序列、商品特征、相关数据(时间,地点)。

  • 输出:预测多个数据(点击率、加购率、转化率、GMV贡献)。

无监督学习:
商品与用户的“聚类”,进行目标人群匹配
  • 使用聚类算法(如K-means、深度聚类)分析商品图片、标题、描述文本,算法自动将数百万件“连衣裙”进一步分成精细簇群。将用户也进行聚类,

LLM
  1. 将这个复杂查询“翻译”成一系列商品属性标签和向量,去检索匹配的商品。

LLM通过用户买了的内容,进行常识推测,主动进行场景化推荐,跨越多个商品类目,组装成一个完整的“解决方案”,而不仅仅是“相似商品”。
强化学习
  • 分工:将招聘长流程拆解为标准化子任务,每个任务由一个“专业特工”(专用Agent)负责。

  • 协作:这些特工在统一调度下协同工作。例如,“需求分析Agent”解析JD后,将需求传递给“寻源Agent”;“寻源Agent”找到候选人后,由“沟通Agent”执行个性化触达。

  • 目标:追求最短路径获得“意向人选”,本质是将HR的寻源与初步筛选能力标准化、产品化。

  • 流程嵌入:AI能力深度嵌入ATS的每一个环节,如自动发布职位、秒级匹配、AI面试官。

  • 人机协同:目标是成为HR的“数字同事”,接管70%的事务性工作,让HR转向战略决策。其AI更侧重于在既定流程框架内提升每一步的效率。

传统的“简历-职位”匹配是二维的。LinkedIn加入三维的“社交图谱”数据:你是否认识这家公司的员工?你的技能是否被业内牛人认可?你关注了哪些行业领袖?这使得匹配更立体、更可信(“你师兄在这家公司,或许可以内推”)。

既然外部有这么成熟的人才检索产品,企业内的人才检索产品的市场定位又是什么呢?

1. 核心优势:管理独一无二的“活数据”资产
内部员工数据的实时性,多样性,准确可验证性更高。
  • 真实的工作行为与产出:项目贡献度、代码质量、协作历史。

  • 持续的动态评估:绩效反馈、360度评价、技能成长曲线。

  • 内部关系网络:跨部门协作紧密度、 mentorship关系。

这些数据构成了对人才的 “立体理解” ,远比任何外部简历都深刻。外部平台无法获取这些数据,这是最根本的差异。但是这也对于企业内的数据运营体系搭建有非常高的要求,如果数据获取不到,这套体系就无法盘活。这里依赖的不仅是企业性的数据收集,更多是员工自发的实时数据提供(出海意向,新技能学习情况),毕竟只有员工自己是最了解自己的。
2. 核心目标:激活内部人才供应链,而不仅是“找人”
与外部平台聚焦于“填补空缺”不同,内部产品的战略目标是盘活内部人才供应链。比如:
  • 业务快速响应:当组建新业务线时,能快速盘点并组合具备所需技能和潜力的内部团队。

  • 前瞻性人才规划:基于员工的技能发展数据和职业意向,为未来的关键岗位识别和培养继任者。

  • 提升组织活力:人才配置到更能创造价值的岗位,提升员工敬业度和留存率。

3. 核心算法:匹配“团队化学反应”与“文化适应性”
外部匹配主要看“人岗硬技能匹配”。内部匹配要从团队和管理者出发:
  • 团队适配度

  • 技能互补性

聊清楚了产品概念的定位,下一步是产品功能的定位是什么?这到底是个AI检索还是AI推荐主导的产品?两者要如何融合呢?

一、人才发现产品,到底是一个目标驱动的产品还是模糊探索的产品?

个人认为人才发现产品是一个AI检索为主,推荐为辅的产品。但是检索准确度决定了这个产品的下线,推荐的洞察性决定了这个产品的上限。
  • 检索场景一定是人主动进系统里检索,强调准确性。当条件不明确时,推荐功能辅助。

  • 推荐功能更重要的定位要做成事找人,让管理者发现人才,发现问题,发现团队洞察,强调惊喜感。

那么有哪些外部系统的产品思维可以借鉴和迁移呢?
感悟一:人才匹配不应只看“技能关键词”是否命中。应像淘宝平衡点击率、转化率一样,构建一个综合评估模型,平衡 “硬技能匹配度”、 “团队文化契合度”、 “员工成长意愿”、 “内部流动性风险” 等多个目标。
感悟二:为管理者和HR提供个性化的信息流,而非一个搜索框。信息流可包含:“根据您新启动的A项目,为您推荐以下可能合适的团队成员”、“您部门的B员工最近完成了机器学习课程,或许可以关注其新技能”。
目标:变“人找人才”为“人才找人”,提升发现效率与意外之喜。
感悟三:场景化解决方案”打包-为排兵布阵做准备
不只是推荐单个人,而是推荐“团队方案”。例如,针对“开发一款轻量级移动应用”的需求,系统可以打包推荐:1名主导的后端开发、1名前端开发、1名兼具产品思维的UI设计师,并提供他们之前合作过的类似项目链接。
感悟四:数据质量非常重要
行为数据:通过邮件、会议、协作工具的交互数据,分析员工之间的合作紧密程度、信息中介角色、跨部门影响力等。这对于组建需要强协作的团队至关重要。
实时数据:不仅记录员工静态的职位和技能,更要持续追踪其动态变化:参与了什么项目、取得了什么可量化的成果、学习了什么新课程、在内部社区分享了什么见解、绩效评价中的关键词变化等
员工主动提供的数据:每年年度盘点前可以让员工检查和更新自己的数据,并和职业发展绑定作为牵引力。
说了这么多,我对于AI人才发现产品功能点的拆分大体如下:

检索场景
推荐场景
混合场景
搜索条件
显性的,可量化的,冰山以上的,更能保证确定性与可控性
系统主导,意图模糊
当用户意图部分明确但不确定时,最需要融合
潜在业务需求
  1. 应急填补
    1. 场景:“项目A的Java工程师下周离职,急需要找一位有微服务经验的继任”

    2. 特点:时间紧迫,目标明确

  2. 精确技能定位
    1. 场景:“我们需要一位会说葡萄牙语且有拉美市场经验的产品经理”

    2. 特点:多条件复合,过滤性强,结果集相对较小

  3. 特定案例请教
    1. 场景:“公司里谁做过隐私合规项目?我想请教一下”

    2. 特点:明确的知识/经验寻源,目标具体

  1. 内部活水(人才流动)
    1. 场景:员工考虑内部转岗,但不清楚有哪些机会适合自己

    2. 特点:员工有流动意向但目标模糊,需要系统发现匹配其隐性技能和兴趣的岗位

  2. 继任者规划
    1. 场景:关键岗位领导者即将退休,寻找潜在继任者

    2. 特点:目标不是找“一模一样”的人,而是找有潜力、可培养的人选,需要发现“黑马”

  3. 团队能力建设
    1. 场景:新业务线启动,需要组建跨职能团队

    2. 特点:需考虑技能互补、性格匹配、过往合作历史等多维度,复杂匹配

  4. 职业发展与学习
    1. 场景:高潜员工下一步该往哪个方向发展?

    2. 特点:结合个人意愿(可能不清晰)、能力短板、组织需求,做发展性推荐

  5. 战略性人才储备
    1. 场景:公司计划2年后进军东南亚市场,提前布局相关人才

    2. 特点:前瞻性、探索性,寻找具备可迁移能力或相关背景的人才

  • “我想找一个数据分析师...”(明确)

  • “...但不确定是要偏向业务的还是偏技术的”

产品定位
透明公平:能看到所有相关信息
速度与精准:救命时刻不容差错
• 深度信息:不只是简历,包括实际项目表现
• 比较分析:能对比多个候选人的优劣
个性化:真正懂我的潜力和兴趣
• 惊喜但合理:推荐我没想到但确实有吸引力的机会
• 解释性:“为什么推荐我?”需要有令人信服的理由
系统性洞察:考虑团队化学反应,不只是个体技能
先用检索找到数据分析师池,再用推荐算法根据用户历史偏好(如过去倾向于招聘业务型人才)排序,并在侧栏推荐“你可能也会考虑的数据产品经理
  • 当用户需要“精准破冰”(检索):
    • 界面:提供强大的搜索框和精细的筛选面板(按冰山上的维度筛选)。

    • 结果:呈现高度相关、匹配度分明的列表。强调“证据”:高亮匹配的关键词,清晰展示符合了哪些硬性条件。

  • 当用户需要“探测冰形”(推荐):
    • 界面:更简洁,可能是对话入口(“描述一下你的需求”)或智能推荐流。

    • 结果:呈现多元化、有惊喜感的候选列表。强调“洞察”与“解释”:
      • “推荐理由:该同事虽无直接管理经验,但在过去三个跨部门项目中均被推举为协调者,展现领导潜力。”(挖掘行为模式)

      • “与您团队文化契合:历史数据显示,您团队成员普遍评价其‘乐于分享’和‘结果导向’,此候选人在匿名调研中在此两项得分最高。”(匹配隐性特质)

技术落地的困境和解法

  1. . 检索场景的“精度”困境:从自然语言到数据库的鸿沟

    困境一:自然语言(NL)与结构化查询(SQL/DSL)的各种“对不齐”

    痛点: 业务方说“找一个懂大模型的Java专家”。

    • “大模型”在数据库里可能是“LLM”、“Transformer”、“GPT”甚至“AIGC”。

    • “专家”是一个模糊形容词,对应库里是“P7以上”?还是“技能掌握度:精通”?还是“做过相关项目”?

    技术难点: 纯粹的Text-to-SQL在大模型幻觉下极易出错,导致查无此人或查非所人。


    困境二:标签体系的“语义丢失”与“更新滞后”

    痛点: 简历里写“曾负责双十一高并发系统”,但标签库里只有“Java”。如果只搜“高并发”,可能会漏掉这个人,因为标签没打上。

    解法:RAG(检索增强)+ 混合检索(Hybrid Search)

    语义与关键词并重: 放弃单纯的倒排索引(关键词匹配)。采用 “稀疏向量(关键词精准匹配)+ 稠密向量(语义模糊匹配)” 的混合检索策略。

    2. 推荐场景的“惊喜”困境:如何计算“隐性关联”?

    困境一:技能泛化与知识推理

    痛点: HR搜“PyTorch”,系统不仅要推荐会PyTorch的人,还得推荐会“TensorFlow”的人,因为他们转栈很快。但传统数据库不知道这两个词的关系。

    困境二:可解释性的黑盒

    痛点: 推荐算法算出一个高分候选人,但如果不能告诉HR “为什么推荐他”(例如:虽然他没写这个技能,但他做过类似项目,且他的导师是该领域大牛),HR是不敢用的


    3. 混合场景的“团队”困境:量化“化学反应”

    困境: 人的特质难以量化,团队的性格互补更是玄学。

    解法:图神经网络(GNN)与组织网络分析(ONA)

    • ONA(Organizational Network Analysis): 基于邮件、会议、IM日志(注意隐私脱敏),构建隐性的协作网络。识别节点: 谁是“信息枢纽”(连接不同部门的人)?谁是“高潜专家”(被咨询技术问题最多的人)?

    • 团队向量化: 不只Embedding人,还将“当前团队”Embedding成一个向量。计算候选人向量加入后,对团队整体向量的“方差”影响(是增加了多样性,还是过于同质化)。