e公司讯,据昆仑万维消息,9月16日,在权威推理榜单Benchmark GSM8K 测试中,昆仑万维完全自研的天工大模型以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),这标志着天工的推理能力达到全球领先,接近GPT-4。
昆仑万维:天工通用大模型推理能力大幅超过GPT-3.5和LLaMA2 达到全球领先水平
转自:证券时报·e公司
转自:证券时报·e公司
e公司讯,据昆仑万维消息,9月16日,在权威推理榜单Benchmark GSM8K 测试中,昆仑万维完全自研的天工大模型以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),这标志着天工的推理能力达到全球领先,接近GPT-4。