欢迎来到查股网! 用户名: 密码: 保存状态: [免费注册]
chaguwang.cn-查股网.中国
查股网.CN

AI语料库概念股票|AI语料库板块龙头股资金流向(实时)

 
 板块概念股龙头股DDX数据(输入板块代码或拼音查询): 概念板块列表
 
AI语料库 ( 板块 994828 )
3508.06 +1.95 %
BBD: 10.15亿   成交额:406.00亿  开盘:3439.22  最低:3428.42  最高:3536.04  振幅:3.14%  更新时间:2026-01-08
DDX: 0.18   DDY: -0.683   特大单差: 4   大单差: -1.5   中单差: -3.3   小单差: 0.8   单数比:0.816  通吃率: 2.50%
操作选项:  刷新间隔: 秒     自动刷新      显示停牌    AI语料库概念股龙头股 AI语料库概念解析 板块新闻 板块研究 业绩预告 板块异动 热点概念  
历史数据:
DDX更新时间:2026-01-08 15:00:00  AI语料库板块DDX分时  AI语料库概念DDE日线  DDE周线  DDE月线  成分股旧版  意见?
页数:
AI语料库概念股介绍
龙头公司介绍(入选板块理由)

岩山科技:2024年4月26日公司在互动平台披露:公司有自己的AI语料库,用于AIGC大模型的训练语料主要基于公司旗下上海二三四五网络科技有限公司拥有的数据及通过互联网获取的公开信息,经过大量数据清洗、整理工作而产生。

中文在线:公司拥有海量优质正版内容资源和创作者资源,结合公司在文学领域的语料数据,目前公司自研的“中文逍遥”数字内容智能生成模型,在保留通用性能力的前提下有效提升小说创作质量,实现小说辅助创作、续写,以及基于角色设定的聊天机器人等功能。此外,公司也在研发推动更多AI多模态产品落地,目前公司已使用AI生成了漫画、动态漫。公司在AI多模态领域持续投入,未来在AI多模态加持下,IP开发制作难度大幅下降,制作周期大幅缩短,打破产能瓶颈,加速了IP商业化落地的进展,借助AI大幅提升公司IP的商业化变现速度。公司历经20多年数字文化领域深耕,沉淀丰富数字内容。公司基于自有大模型数据需求,不断整合高质量数据包含文字/音频/图片/视频等多种类型数据600TB,目前已有有声书及干音、百万量级中英文出版物、原创文学数据、视频数据,以及亿级图片、题库、期刊、行业问答、中外文平行语料等近40种文字和多模态语料及成品语料集。目前,公司已与数十家大模型建立数据及数据服务合作,其中包含央国企、互联网巨头及AI新势力等多家头部大模型。

*ST天择:2024年是中广天择音视频数据算料业务的启动元年。公司聚焦大模型基模训练与垂直领域优化需求。公司以4K超高清专业级原生视频为核心的视频算料、以48kHz高保真音频垂类场景数据库为核心的音频算料,已实践将标注前置嵌入原数据生产工作流。自身专业的成建制算法研发团队对多模态算料的处理加工及精品定制数据等工作形成技术底座,构筑天择特有的精品算料数据库,形成“多模态融合+垂类精加工”的全链路算料体系。公司对国内大模型公司已完成交付数万小时音视频粗加工及精加工数据集,报告期已确认近500万元收入。

世纪天鸿:公司基于30年所积累的专业化、系统化的教育内容,具备大模型训练三个必备要素之一的“语料”资源,由于该“语料”资源已经实现出版流程,其差错率达到万分之一以下,结合原有渠道优势可以在教育场景中开发基于大模型的垂直领域AI+教育应用。公司所投资的笔神作文在AI作文辅导领域持续突破,目前笔神作文APP累计用户超过2,200万,作文社区每月投稿量超过30万篇,积累了500多万篇的优质的作文语料。笔神作文的语料库积累了5年时间,超过30万篇基于人工反馈的专业微调数据,作为全国领先的中小学生作文学习平台和投稿社区,形成了较强的竞争壁垒。

值得买:公司从最初的消费内容业务向智能营销等方向延展,可以借助更广泛的业务触达消费者、电商平台和品牌商,并依托所沉淀的消费数据对消费产业形成更深层次的理解。目前,随着公司逐步沉淀来自于消费内容业务板块和智能营销业务板块等的更多数据资源,已形成一个能够涵盖人、货、场等多种维度的底层数据体系。截至2025年6月末,公司商品数据库已经收录了34.7万+品牌、2290.9万+聚合商品。这些数据一方面提升了“什么值得买”平台结构化展示商品信息的能力,提升了“什么值得买”平台搜索与推荐内容分发的效率,提升了其他消费内容业务和智能营销业务的运营效率;另一方面对公司训练“值得买消费大模型”,以及为品牌提供围绕营销全链路的数据洞察和营销解决方案也发挥重要作用。

掌阅科技:2023年4月27日公司投资者关系活动记录表披露:首先,IP对于数字阅读垂直领域的模型非常有价值,我们也在把优秀的IP语料灌输到模型当中,来提升模型的AIGC智能化程度。其次,在IP衍生方面,AI可以帮助提升降低IP衍生成本,提升制作效率,从而提升IP衍生价值。在数字阅读垂直领域的模型当中,数据是非常有价值的,我们有近300TB的数据集,在业内处于领先地位。我们希望自身优质的语料数据能够用来训练我们自己在数字阅读垂直领域的模型,打造自身的竞争优势。

飞利信:2024年12月10日公司在互动平台披露:公司旗下丽水云数据中心已升级为算力(智算)中心,并以此为依托展开了与各大人工智能产品厂商及技术研究机构的合作。在Ai语料方面,我们已完成了数据处理平台向模型训练数据准备(构造、标注、增强)平台的技术升级,并参与了相关行业标准的技术要求制定工作。

上海钢联:作为行业领先的数据服务商之一,突破传统数据集成模式,聚焦AI技术与垂类大模型深度应用,构建“数据生产-智能分析-决策赋能”全价值链服务体系。公司积极探索行业大模型研发和另类数据采集领域,打造“大模型数据标注平台”,不断完善大宗商品行业垂类大语言模型“钢联宗师”及“小钢”数字智能助手,持续加码大数据能力、深化AI技术创新打造上海钢联EBC产品,提供数字化转型解决方案。以需求为导向强化数据产品开发和服务,为产业链上下游各类企业、金融机构、政府等主体,提供精准的数据跟踪、深入的市场洞察和先进的数据决策解决方案,推动大宗商品行业数字化进程进入“认知智能”新阶段,与客户共同迈向创新突破和可持续发展之路。2024年8月,“上海钢联大宗商品价格智能预测算法”成功通过国家网信办备案,是国内大宗商品价格智能预测领域首个通过的算法备案;同年12月,“上海钢联宗师大宗商品行业垂直大模型算法”成功通过国家网信办备案;“小钢”数字智能助手1.6版本也获得了行业与相关部委的认可。

海天瑞声:2024年3月15日公司在互动平台上披露:公司是专业的人工智能训练数据服务提供商,目前正在围绕AIGC/大模型数据服务领域进行投入、建设。一方面,公司将基于现有商业模式,开发大模型相关的专业训练数据集,该数据集建成后,将提供可供大模型训练和评测的不少于10个品类的专业数据集,显著提升行业内面向大模型训练数据集的类别和质量,协助实现公共数据、社会数据等各类高价值数据资源汇聚,实现基于大模型通用能力和垂直领域数据的训练学习。另一方面,公司计划将研发设计数据生产垂直大模型,公司全栈自研的数据生产垂直大模型,将可辅助完成面向多个下游任务的数据设计与处理规则,形成包括数据清洗方案设计、指令方案设计、指令泛化与迁移、指令数据验证、多模态数据方案等在内的多项生成能力,以及在上述方案下的原始数据及标注成果生成能力。 公司已与相关客户签订了大模型训练数据集相关的业务合同或意向订单。此外,公司已与其他大模型领域的知名机构签署了合作协议,未来拟围绕人工智能大模型数据处理技术、大模型数据集供给和大模型评测等方面进行合作。

拓尔思:2024年,公司为解决各数据产品部门多源异构数据采集分散、治理割裂、标准缺失、应用滞后四大痛点,研发了拓思数据平台。该平台定位为拓尔思集团的企业级数据资产智能中枢,构建“采-存-治-用”全链路赋能体系,通过基础治理、智能增强、应用赋能三级架构支撑前台业务场景数星、网察、数家等数据服务产品实时数据调用,实现场景化服务支撑,推动数据要素向业务价值的深度转化,进一步释放数据资产潜能。截至2024年12月31日,公司累计采集的数据总量超5,000亿条。公司每日新增数据采集量平均约为5亿条以上,每年新增文本与图片超1,500亿条,短视频约400亿个,每年经处理后的文字与索引存储300TB以上。公司始终紧跟国家政策导向,是国内首批数据资产入表的上市企业之一。公司数据服务类OpenAPI已在北京、上海、深圳、郑州、湖南、浙江、贵阳、西部等数据交易所挂牌。另外,公司积极参与国家重要行业语料库的共建工作,如中国互联网安全协会数据集、CCI中国互联网语料集等。

中远海科:面对数字经济和人工智能的迅猛发展,公司聚合算力、数据、算法、场景等核心资源,明确“算力基础、数据供给、算法牵引、场景落地”为发展路径。公司已构建一个适当规模的算力资源池,通过公司自主研发的混合云计算管理平台,集私有云、公有云及容器云为一体,无缝集中管理跨多个数据中心的云计算资源。公司已研发形成支撑从数据采集、存储、分析、可视化展示、移动应用的数据中台技术架构体系,加速构建高质量的航运大数据集作为关键生产要素,以融合的多源数据为驱动,以机器学习、强化学习、深度学习等算法为工具,深度挖掘数据中的隐藏模式和规律,船视宝平台已经研发了超200种核心算法,能够自动识别和预测船舶的各种行为。

健麾信息:2024年3月21日公司在互动平台上披露:截至目前,公司累积的处方单数据已高达数十亿条,增长速度在10%左右。这些数据主要源自国内各大医院药房部门的处方药发药记录。全国百强医院中超过半数都是公司的合作伙伴,共同构建了强大的合作网络,确保了数据的专业性和参考价值。同时,公司拥有成熟的数据脱敏技术,能够在保护用户隐私的同时,确保脱敏后的数据可用于支持国内大型模型的训练工作。

汇纳科技:2024年,公司深度整合多模态大模型能力,建设了深度结合线下商业场景的大规模高质量多模态数据集,开发了新一代多模态细粒度行人Re-ID系统;面向垂直应用场景,全面整合LLM大模型、多模态大模型、AI Agent等AI技术能力,开发ASR语音转写、文本语义分析、图像理解与分析等垂类AI大模型,构建多个垂类AI场景解决方案,赋能餐饮零售、政务等泛行业客户;同时,面向海外业务场景,积极整合海外先进AI能力与自研产品,打造国际化AI客流解决方案。在数据要素方面,2024年,公司开发了汇纳大数据底座软件;综合运用区块链、数字身份DID、安全载体、可信时间戳、国密密码等技术,构建开发了汇纳可信数字身份系统、汇纳数据空间和安全交换平台等新解决方案,面向多场景推广应用。

元隆雅图:公司持续强化AI技术驱动的差异化竞争优势,通过成立AI研究院,深度开发营销垂类AIGC模型,构建行业领先的AI数据中心。实现了产品创意设计、图文视频内容生产、达人智能匹配、IP数字资产生成等全流程AI化升级,显著提升业务效率与服务质量。公司自主研发的UOVAMETA平台已升级为SaaS多链数字私域社群运营平台,通过整合WEB3、AIGC文生图垂类模型、AR/VR及3D生成技术,打造虚实融合的快速开发能力。平台支持企业一站式完成数字藏品创作、沉浸式场景搭建及智能会员运营,为客户提供更高效的IP数字化营销解决方案。通过持续迭代AI技术与深化行业应用,公司构建了从内容生产到数字营销的全链路智能服务体系,进一步巩固了在创意营销与WEB3商业化方面的领先优势。2023年6月9日公司在互动平台披露:公司创意设计团队已经在使用ChatGPT及一些AI绘画工具辅助创意设计工作,以拓宽创意思路、提高工作效率。2024年5月22日公司在互动平台披露:公司基于新媒体营销业务长期积累的爆品文案,可以作为AIGC模型训练的语料。

绿盟科技:2024年3月29日公司在互动平台披露:训练数据的来源、质量、多样性等因素在安全行业大模型的研发过程中起着至关重要的作用。公司经过多年的积累和转化,形成覆盖运营、攻防等多个方面的高质量语料数据体系,确保训练数据具备高质量、全面性和实时性,并做好数据隐私和安全保护以确保数据的合法获取和使用。

麦克奥迪:在医疗领域,历经十余年深耕,公司已累积超1,260万例DNA倍体宫颈筛查标本、40多万例其他组织DNA倍体标本及100万张典型病例数字病理切片,成为国内最大的病理数据库之一。这些数据不仅能为AI辅助诊断产品的开发提供海量训练基础,还能支撑公司利用数据推动病理科从传统模式向智能化、标准化转型;同时,智慧光学可协同开发硬件设备与AI软件,优化远程数字病理会诊系统的服务效率,未来进一步构建覆盖远程诊断、质控、教育培训的全链条智慧病理服务体系。

三六零:针对世界前沿的AI技术和AI安全难题,360躬身入局大模型。依托多年人工智能技术积累及搜索浏览器等场景优势,360推出自研千亿参数的认知型通用大模型“360智脑”,可覆盖大模型应用所有场景,综合能力位列国内大模型第一梯队。同时,公司基于“360智脑”底层能力推出了税务大模型、安全万事通大模型、医疗大模型、保险行业知识大模型、政务大模型,问题识别准确率、回答准确率均达到95%以上。基于360智脑的能力将自有两大优势场景“360浏览器”“360搜索”颠覆式升级为“360AI浏览器”“360AI搜索”,市场反响强烈。2023年12月,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布,360智脑成为首批通过评测的四款国产大模型之一。依靠360浏览器、360搜索等高频流量入口,形成了10T+优质文本数据及海量图文视频数据,内容覆盖全球多个语种、涉猎金融、法律、房产、体育、医药等全行业范围,形式包括文档、书籍、散文、诗歌等,为大模型训练提供了大规模、多样性、高质量的训练语料。

华数传媒:公司拥有庞大的版权节目资源,与800多家内容供应商合作,拥有百万小时的数字化节目内容媒体资源库,包括电影、电视剧、综合资讯节目、娱乐综艺、原创动漫和音乐节目等,同时着眼优质内容聚合、垂直领域细分与本地内容运营。丰富的媒体资源储备为与运营商和终端厂商的长期合作奠定了基础,为用户提供多样化的收视内容。

万达信息:2025年3月4日公司在互动平台披露:万达信息成功研发大模型医疗语料工具软件,可用于大模型医疗语料的治理、开发、整合及重构。 另外,万达信息和“小库”语料终端的发布者上海库帕思科技有限公司以及多家国产芯片厂商共同成立语料终端创新联合体。作为创新联合体的重要成员,万达信息凭借在医疗、智慧城市等领域拥有的丰富行业经验和大量的数据资源,为“小库”语料终端提供高质量的垂类语料数据与模型算法支持,进一步丰富语料终端的场景化智能应用行业覆盖范围。同时,万达信息在数据安全和隐私保护方面的技术积累,也将有助于提升语料终端的安全性和可靠性。

同方股份:在知识内容与服务领域,同方知网继续深耕于大规模集成化数字出版、超大型中外文知识资源数据库建设及数字出版、知识管理和智能信息处理技术研发,不断加快产品服务模式创新和技术革新,引领行业发展。2024年上半年,国家知识产权局中国专利信息中心与同方知网签署战略合作协议,双方将共同开展项目合作、数据对接及相关产品研发,为知识产权和科技信息服务等领域提供切实有效的解决方案;同方知网中标由中国科学技术协会科学技术创新部组织实施的“2024年度科技期刊双语传播工程”项目;同方知网策划开展“数字阅读”进机关、进校园、进法检、进企业、进医院等系列公益活动,累计为100余家机构开通新时代智慧党建学习平台等党政行业数据库阅读服务。针对企业科研人员,同方知网联合中国电子学会等8家行业组织发起“知识赋能创新发展”科技创新知识服务季活动,为180余家企业科研人员、科研管理人员提供高效知识服务。同方知网将知识传播与健康事业深度融合,推广中国医院知识总库CHKD、临床诊疗知识库、医药知识资源总库等专业知识库数字阅读体验。

龙头公司介绍(入选板块理由)
行情数据
序号股票代码名称|自选股1|自2|自3|查股数据
1002195岩山科技 分时 日线 板块
2300364中文在线 分时 日线 板块
3603721*ST天择 分时 日线 板块
4300654世纪天鸿 分时 日线 板块
5300785值得买 分时 日线 板块
6603533掌阅科技 分时 日线 板块
7300287飞利信 分时 日线 板块
8300226上海钢联 分时 日线 板块
9688787海天瑞声 分时 日线 板块
10300229拓尔思 分时 日线 板块
11002401中远海科 分时 日线 板块
12605186健麾信息 分时 日线 板块
13300609汇纳科技 分时 日线 板块
14002878元隆雅图 分时 日线 板块
15300369绿盟科技 分时 日线 板块
16300341麦克奥迪 分时 日线 板块
17601360三六零 分时 日线 板块
18000156华数传媒 分时 日线 板块
19300168万达信息 分时 日线 板块
20600100同方股份 分时 日线 板块
序号股票代码名称|自选股1|自2|自3|查股数据
行情数据DDE数据资金单数单差数据特大(%)大单(%)小单(%)通吃率(%)主动率(%)
最新价涨幅换手率量比DDXDDYDDZ5日10日连续连增成交量(万元)BBD(万元)单数比买入卖出特大差大单差中单差小单差买入卖出买入卖出买入卖出通吃率1日通吃率5日通吃率10日通吃率20日主动率1日主动率5日主动率10日流通盘(万股)
10.389.96%34.00%13.670.986-6.412-14.35257501899299.0055079.700.7186464194640645.60-2.70-5.502.6032.10%26.50%20.70%23.40%23.40%20.80%2.910.58.85.725.0087.1377.816560126.2
26.874.88%12.54%1.521.4302.10725.0753512219605.8925035.071.36748491662678.702.70-3.80-7.6019.90%11.20%28.00%25.30%20.30%27.90%11.42.51.5-1.513.3207.2765.44166041.1
20.744.12%1.95%2.420.2300.58531.24225115224.92616.541.559105416435.006.80-3.10-8.7011.00%6.00%36.00%29.20%16.50%25.20%11.81.31.4-1.65.4334.585-1.64413000.0
10.243.43%4.94%0.910.084-1.640-11.772231317615.91299.470.6411262881001.600.10-6.905.205.40%3.80%25.00%24.90%38.00%32.80%1.7-2.3-2.2-3.620.9564.1271.27735264.8
46.553.35%24.28%1.031.2381.46910.1123522135869.776929.361.12727678312045.000.10-2.40-2.7015.00%10.00%29.10%29.00%20.20%22.90%5.11.01.2-0.48.7341.2301.44112233.4
25.603.35%10.27%0.87-0.257-2.945-17.1462500113255.98-2831.400.67854859371703.80-6.30-4.507.0013.60%9.80%21.60%27.90%34.50%27.50%-2.52.22.51.68.9116.6104.95243889.7
5.143.01%5.15%1.900.0000.4554.070221134958.01-0.001.1471418416275-2.102.102.50-2.504.80%6.90%24.70%22.60%31.70%34.20%0.00.2-2.3-6.35.8237.0871.733131822.2
26.032.44%4.69%1.510.126-0.179-0.317361137279.131006.540.92512099111972.200.50-1.90-0.807.20%5.00%33.10%32.60%26.10%26.90%2.70.5-0.2-1.314.2023.9614.04930645.3
125.612.10%6.75%1.350.0000.0040.054261251775.730.001.00162726279-0.700.70-0.700.7015.90%16.60%32.20%31.50%18.80%18.10%0.0-0.32.7-0.521.1849.6836.5956032.5
20.481.99%4.78%1.360.3490.29510.747241285603.556249.061.092288253149110.60-3.30-5.30-2.0019.30%8.70%23.10%26.40%27.20%29.20%7.3-2.0-0.5-3.813.3136.3695.78587303.0
16.401.99%2.37%1.870.377-0.28510.816351114383.992287.050.839908176217.308.60-9.80-6.1012.00%4.70%25.50%16.90%34.70%40.80%15.94.93.1-0.818.5193.8840.46237136.4
20.121.98%1.84%1.40-0.059-0.092-3.88212024994.44-159.820.940447242022.10-5.305.90-2.703.00%0.90%6.30%11.60%54.70%57.40%-3.2-5.2-4.8-3.69.937-4.221-5.81013600.0
42.801.98%4.90%1.030.314-0.0385.858474024945.801596.530.987776176584.002.40-7.000.6010.30%6.30%33.50%31.10%25.60%25.00%6.44.54.9-0.11.5698.7707.70711992.9
18.961.88%5.54%0.79-0.011-1.427-6.620120124600.96-49.200.72815812115160.70-0.90-4.704.905.50%4.80%14.30%15.20%43.50%38.60%-0.2-2.1-2.6-4.713.7396.9142.80023593.3
7.771.83%1.83%0.92-0.053-0.387-13.749020111418.92-331.150.72286536251-3.700.80-2.505.405.20%8.90%25.90%25.10%38.50%33.10%-2.9-4.5-3.5-2.74.059-1.549-1.37080805.6
16.791.70%1.46%0.980.000-0.442-8.281241112617.97-0.000.710897263691.90-1.90-5.905.906.30%4.40%17.40%19.30%43.10%37.20%0.0-3.7-4.4-5.810.406-7.178-7.66151536.9
11.421.69%2.68%0.950.1210.0666.4132412214463.059650.831.04769929732193.501.00-2.50-2.0018.30%14.80%25.50%24.50%26.70%28.70%4.5-3.3-1.8-5.310.8802.5353.068699955.8
7.951.66%0.96%1.40-0.117-0.156-20.310350012856.68-1568.510.780104088121-10.70-1.501.3010.904.00%14.70%21.50%23.00%44.80%33.90%-12.20.4-0.1-2.91.0059.1457.796169987.6
6.781.65%1.50%1.09-0.081-0.426-21.924240014611.34-789.010.63997936258-6.801.40-3.008.404.30%11.10%28.10%26.70%37.20%28.80%-5.4-2.1-2.1-3.819.79810.4114.921143918.3
9.251.65%2.48%1.100.124-0.290-4.566352276986.483849.320.80533116266424.001.00-7.002.0018.90%14.90%27.50%26.50%26.70%24.70%5.01.3-0.3-3.67.0936.0175.833335029.8
最新价涨幅换手率量比DDXDDYDDZ5日10日连续连增成交量(万元)BBD(万元)单数比买入卖出特大差大单差中单差小单差买入卖出买入卖出买入卖出通吃率1日通吃率5日通吃率10日通吃率20日主动率1日主动率5日主动率10日流通盘(万股)
AI语料库概念板块解析(994828) AI语料库龙头股概念股一览
语料库是一定规模的真实语言样本的集合,包括但不限于文本、语音或其他语言数据等,AI语料库是训练和优化AI大模型的数据基础
有问题请联系 767871486@qq.com 商务合作广告联系 QQ:767871486
查股网以"免费 简单 客观 实用"为原则,致力于为广大股民提供最有价值和实用的股票数据作参考!
Copyright 2007-2024
ddx.gubit.cn 查股网