凤凰网科技讯 5月26日,随着基础模型的快速发展和AI Agent进入规模化应用,被广泛用于评估AI能力的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实反映AI系统的客观能力正变得越来越困难,这其中最直接的表现——基础模型“刷爆”了市面上的基准测试题库,纷纷在各大测试榜单上斩获高分甚至满分。
今日(5月26日)早盘,A股、港股震荡回调。A股市场今天上午窄幅震荡,总体表现相对疲弱,TMT赛道走强。
在线咨询:
邮箱: 308992132@qq.com