当前快讯:使用评价指标工具

(资料图)

评估一个训练好的模型需要评估指标，比如正确率、查准率、查全率、F1值等。当然不同的任务类型有着不同的评估指标，而HuggingFace提供了统一的评价指标工具。

1.列出可用的评价指标通过list_metrics()函数列出可用的评价指标：

deflist_metric_test():#第4章/列出可用的评价指标fromdatasetsimportlist_metricsmetrics_list=list_metrics()print(len(metrics_list),metrics_list[:5])

输出结果如下所示：

157["accuracy","bertscore","bleu","bleurt","brier_score"]

可见目前包含157个评价指标，并且输出了前5个评价指标。

2.加载一个评价指标通过load_metric()加载评价指标，需要说明的是有的评价指标和对应的数据集配套使用，这里以glue数据集的mrpc子集为例：

defload_metric_test():#第4章/加载评价指标fromdatasetsimportload_metricmetric=load_metric(path="accuracy")#加载accuracy指标print(metric)#第4章/加载一个评价指标fromdatasetsimportload_metricmetric=load_metric(path="glue",config_name="mrpc")#加载glue数据集中的mrpc子集print(metric)

3.获取评价指标的使用说明评价指标的inputs_description属性描述了评价指标的使用方法，以及评价指标的使用方法如下所示：

defload_metric_description_test():#第4章/加载一个评价指标fromdatasetsimportload_metricglue_metric=load_metric("glue","mrpc")#加载glue数据集中的mrpc子集print(glue_metric.inputs_description)references=[0,1]predictions=[0,1]results=glue_metric.compute(predictions=predictions,references=references)print(results)#{"accuracy":1.0,"f1":1.0}

输出结果如下所示：

ComputeGLUEevaluationmetricassociatedtoeachGLUEdataset.Args:predictions:listofpredictionstoscore.Eachtranslationshouldbetokenizedintoalistoftokens.references:listoflistsofreferencesforeachtranslation.Eachreferenceshouldbetokenizedintoalistoftokens.Returns:dependingontheGLUEsubset,oneorseveralof:"accuracy":Accuracy"f1":F1score"pearson":PearsonCorrelation"spearmanr":SpearmanCorrelation"matthews_correlation":MatthewCorrelationExamples:>>>glue_metric=datasets.load_metric("glue","sst2")#"sst2"oranyof["mnli","mnli_mismatched","mnli_matched","qnli","rte","wnli","hans"]>>>references=[0,1]>>>predictions=[0,1]>>>results=glue_metric.compute(predictions=predictions,references=references)>>>print(results){"accuracy":1.0}>>>glue_metric=datasets.load_metric("glue","mrpc")#"mrpc"or"qqp">>>references=[0,1]>>>predictions=[0,1]>>>results=glue_metric.compute(predictions=predictions,references=references)>>>print(results){"accuracy":1.0,"f1":1.0}>>>glue_metric=datasets.load_metric("glue","stsb")>>>references=[0.,1.,2.,3.,4.,5.]>>>predictions=[0.,1.,2.,3.,4.,5.]>>>results=glue_metric.compute(predictions=predictions,references=references)>>>print({"pearson":round(results["pearson"],2),"spearmanr":round(results["spearmanr"],2)}){"pearson":1.0,"spearmanr":1.0}>>>glue_metric=datasets.load_metric("glue","cola")>>>references=[0,1]>>>predictions=[0,1]>>>results=glue_metric.compute(predictions=predictions,references=references)>>>print(results){"matthews_correlation":1.0}{"accuracy":1.0,"f1":1.0}

首先描述了评价指标的使用方法，然后计算评价指标accuracy和f1。

关键词：

当前快讯:使用评价指标工具

2023-06-28 02:36四川高速公...

最后一页

相关阅读

当前快讯:使用评价指标工具

评估一个训练好的模型需要评估指标，比如正确率、查准率、查全率、F1值

2023-06-28 02:36四川高速公路最新路况实时播报|天天快消息

在我们出行前一定要把自己所去的地方的路况弄清楚，避免在出行过程当中

全球播报:02812340是诈骗电话吗 02812340

1、12340是全国社情民意调查中心电话号码，02812340是四川省统计局社情

环球今日报丨90%靠进口，国产手机技术不行？纽约时报：苹果更依赖中国制造

众所周知，近几年，美国不断的将中国的科技公司纳入实体清单中进行打压

泓盈服务难解关联方依赖，第三方项目中标率不足3成

泓盈服务难解关联方依赖，第三方项目中标率不足3成,股权,中标率,港交所

太阳的40亿亿倍！科学家发现宇宙中最剧烈的光学紫外耀发_今日报

科技日报记者金凤6月27日，中国科学院紫金山天文台发布，该台研究员范

多元算力筑牢AI新基建 京东云发布多款一体机打造安全可控数字基础设施|当前滚动

6月27日，2023年京东云城市大会上海站圆满落幕。国家信息中心信息化和

2023上半年中国房地产总结与展望（产品篇）

2023上半年中国房地产总结与展望（产品篇）,四房,小户型,高层住宅,2023

世界热推荐：教学竞赛展风采 长沙市开福区“园丁杯”教学竞赛在金湾小学举行

6月27日，长沙市开福区“园丁杯”智慧课堂教学竞赛小学数学决赛在金湾

突发！特斯拉储能系统引发火灾！

6月19日，美国圣罗莎一栋房屋发生火灾，造成价值约2万美元的损失，火灾

每日报道：工信部部长金壮龙：2022年底中国中小微企业超5200万户

中小企业能办大事，是推动创新、促进就业、改善民生的重要平台。在6月2

【世界新视野】年末利润分配有余额吗_年末利润分配账务处理

1、借:本年利润100贷:利润分配-未分配利润100借:利润分配-未分配利润10

【高清组图】贵州黔西：雾漫山乡景如画_每日速递

盛夏时节，地处乌蒙山腹地的贵州省黔西市中坪镇顺石村山间云雾缭绕，景

恭喜考上大学的短贺词_恭喜考上大学的短贺词举例-天天热资讯

欢迎观看本篇文章，小升来为大家解答以上问题。恭喜考上大学的短贺词，

日本将外汇事务最高官员神田真人的任期延长一年，在日元新一轮跌势之际，这位主导去年规模高达650亿美元汇市干预策略的官员继续留任显得不同寻常

日本将外汇事务最高官员神田真人的任期延长一年，在日元新一轮跌势之际

翡翠原石专业知识教程 学会这样看翡翠原石你就不在是小白_环球滚动

hello大家好，我是大学网网小航来为大家解答以上问题，翡翠原石专业知

皇家加勒比邮轮游记_皇家加勒比邮轮

1、皇家加勒比游轮有限公司（RoyalCaribbeanCruisesLtd ）总部位于美国

芝大公布23-24文书题目，“顶级烧脑”还得看它...

芝加哥大学因挑战性的文书和严谨的学术而闻名，每年芝大文书的趣味性和

涨停雷达：ST板块异动 *ST博天触及涨停|今日观点

今日走势：*ST博天今日触及涨停板，该股近一年涨停40次。 异动原因

世界热点评！KPL封面观察丨第二周收官日上演三场零封 常规赛首轮进入“免试“冲刺阶段

封面新闻记者蔡世奇6月25日，2023KPL夏季赛常规赛第二周比赛收官，这一

湖北十堰市三个重大林业项目可行性研究报告获发改委批复

湖北天门生物医药产业在创新绿色发展新赛道上加速迭代

2021中国攀岩自然岩壁系列赛（重庆奉节站）暨年度总决赛结束

推动侦查办案工作高质量发展 京津冀三地检察机关召开交流研讨会

感动！牺牲移民管理警察蔡晓东妻子的朋友圈令人破防……

多元算力筑牢AI新基建京东云发布多款一体机打造安全可控数字基础设施|当前滚动

世界热推荐：教学竞赛展风采长沙市开福区“园丁杯”教学竞赛在金湾小学举行

翡翠原石专业知识教程学会这样看翡翠原石你就不在是小白_环球滚动

今日走势：*ST博天今日触及涨停板，该股近一年涨停40次。　　异动原因

世界热点评！KPL封面观察丨第二周收官日上演三场零封常规赛首轮进入“免试“冲刺阶段

推动侦查办案工作高质量发展京津冀三地检察机关召开交流研讨会