产品和服务>>>数据采集与标注

趋势分析

 

数据决定了 AI 的落地程度

目前人工智能商业化在算力、算法和技术方面,基本达到阶段性成熟。通过算法和应用的落地来真正解决行业具体痛点,需要采集大量人工智能相关的原始数据,并经过标注处理后做算法训练支撑,可以说数据决定了AI的落地程度。
 

新兴应用场景对AI数据需求日益旺盛

AI行业高速发展,智能驾驶、智能终端等领域不断发展,应用落地不断加速。以计算机视觉为例,一个新场景的开发支持需要上万张甚至数十万张不等的经过采集和标注的图片。随着AI应用场景的丰富,对AI数据服务将产生长期海量的需求。
 

AI数据服务更加注重专业和质量

随着AI行业商业化发展,落地场景对AI数据的需求更加多样化和定制化,也对AI数据服务的专业性和质量提出了更高的要求,作坊式中小数据服务商将逐渐被市场淘汰,技术、规模、专业度领先的品牌数据服务商将越来越受到青睐。

业务痛点

 

数据安全脆弱

人工智能数据的获取有安全合规要求,需用户授权允许采集和训练,若滥用或通过非合法手段获取,易产生法务风险。
 

数据质量难保障

训练数据的质量严重影响算法有效性,作坊企业缺乏人员管理和质检手段,数据质量参差不齐,数据质量难以得到有效保障。
 

数据处理效率低

自有团队难以快速扩张,外部小型代理商管理混乱,整体缺乏科学的项目管理流程,数据处理效率明显不足。
 

投入成本高

自建数据采集、标注团队模式过重,且需要一套完整的工具和流程支撑,人力、技术和工具投入成本过高。

价值主张


				

架构流程图


				

方案优势

数据保障更安全
严格的法务监管流程,安全的私有化数据部署,防数据泄漏的答题管理机制,实时监控和加密的标注设备,保证数据安全无风险。 
数据质量更精准
严格的人员培训作业机制和三轮数据审核机制,并辅以智能审核算法和智能化管理平台,保障数据质量远高于行业平均水平。   
处理速度更高效
百位项目方案专家,两千百度山西基地全职标注,两万签约外场专职标注,3万名众包在线标注用户,实现百万级数据处理能力。
支付费用更优惠
凭借自建标注基地、科学众包任务分发模式、智能化数据采集与标注工具,实现规模效应和高效作业,降低成本使付费客户受益。

客户案例

车企

某车企欲研发L4级自动驾驶,需对道路数据进行采集标注,百度自有采集车队具备甲级测绘资质,可合法合规对道路数据进行采集,因此寻求与百度智能云合作。采集车搭载64+16线激光雷达,累计采集道路共计2500公里。在标注阶段提供山西专项人力+资源平台人力调配方案,总计投入5000标注人力,通过连续帧预测、障碍物属性验证、自动审核等辅助算法提高标注质量和效率,累计完成超3000万元素标注,高质量提交了数据结果。

互联网公司

某互联网公司为提升藏语方言的识别和翻译准确率,与百度云合作,招募870个藏民,单人录制1000句,需使用客户开发的工具进行采集。整体采集量为87万条藏语语音,覆盖安多、康巴、卫藏三个藏语方言区,而藏区采集会面对安全风险大、质检难度高等重重挑战。百度团队第一时间联系到当地资源布点,并派遣项目经理在西藏,青海多地指导采集。整个周期共1个半月,最终交付数据92万条,验收合格率高于95%,满足客户交付要求。

手机厂商

某手机厂商新机型发布在即,采用人脸识别解锁技术,需采集多国人种人脸照片用于模型训练。百度智能云在参考采集地数据安全相关法律规定下,迅速启动项目并协调资源投入,派遣项目经理奔赴阿根廷、乌克兰、俄罗斯、巴西、乌干达、赞比亚、菲律宾、埃及、印度、墨西哥,使用客户保密机型,2个月时间内完成3个人种合计2万人采集。2个月内完成项目,保证客户每个训练节点数据都按计划交付,数据验收100%合格,助力机型顺利发布。

相关推荐

 

数据采集

适用于各种复杂场景数据采集的需求
 

数据标注

专业的标注团队高效、稳定提供数据标注服务
 

一体化智能驾驶数据解决方案

提供一整套智能驾驶数据服务,打造数据驱动闭环

定制服务

专业AI数据助力企业智能领域发展