当前位置:网站首页 > R语言数据分析 > 正文

argparser(argparse模块有什么用)



注:本文仅用于记录学习过程和展示实现方法,不展开机器学习的原理

首先是环境配置,以Python为例。如果只是想要体验一下机器学习,可以直接安装官方版本(https://www.python.org/downloads/)。但要注意版本号不宜太高,因为并非所有第三方模块都有良好的向上兼容性(比如之前直播时有同学推荐用autogluon实现机器学习模型的自动化调参,但autogluon 0.8.2对Python的版本要求为“Python >=3.8, <3.11”)。如果想要正经学一下编程,可以安装集成度更高的发行版,如Anaconda,省去常用第三方模块的安装。

本文以安装官方版本的情况为例,安装后请运行“命令提示符”,安装sklearn模块,命令为:

pip install scikit-learn

输入命令后按回车并等待安装结束即可。我这里因为安装过了,所以直接提示already satisfied。正常来说会同时将其依赖的其他模块一并安装(比如后面要用的numpy)。

然后开始借(chao)鉴(xi)代码,我参考的资料是这篇博文“决策树鸢尾花算法讲解”(https://blog.csdn.net/godnightshao/article/details/)

打开IDLE,新建文件,把以上代码复制粘贴进去,保存,按F5运行即可,样子如下:

构造模型时(即clf = DecisionTreeClassifier(random_state=0)这一行)的参数设置都是默认的,可能需要调节的参数有很多,比如分支准则(criterion)、分支选择策略(splitter)、最大深度(max_depth)、最大特征数量(max_features),这里不做展开,请自行按需学习~

测试发现,score()命令返回的是micro口径的F1 score。测试比较粗糙,也可能结论不对,保险起见还是推荐用sklearn.metrics中的f1_score()命令。

这里还有一个问题,如果我想用自己的数据来训练,要怎么办呢。在运行结果窗口中分别用type()命令和print()命令看看数据集到底长什么样子。为了能显示的下,这里只打印了数据集的前5条内容。特征和标签都是numpy的N维数组(ndarray),特征数据集在形式上是:一个样本的N维特征为1个列表,所有样本外层再套1个列表。标签数据集在形式上直接就是1个列表,内容依次为每个样本对应的标签(鸢尾花的类别,一共3种,用0、1、2表示)。这就是用于构造自己的数据集的格式要求了。

到此这篇argparser(argparse模块有什么用)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • topcoder竞赛(topcoder排名)2026-02-13 11:18:05
  • store苹果商店为什么下载不了软件(苹果商店为什么不能下载软件)2026-02-13 11:18:05
  • redis连接不上是啥原因(redisson连不上redis)2026-02-13 11:18:05
  • yarn日志怎么看报错(spark on yarn 日志)2026-02-13 11:18:05
  • rasie德州里什么意思(dealer德州什么意思)2026-02-13 11:18:05
  • yum相关命令(yum providers命令)2026-02-13 11:18:05
  • 跨域请求(跨域请求origin为null)2026-02-13 11:18:05
  • springboot用户密码加密(springboot登录密码加密)2026-02-13 11:18:05
  • 启动docker守护进程(docker维护)2026-02-13 11:18:05
  • impdp导入命令(impdp导入命令参数详解query)2026-02-13 11:18:05
  • 全屏图片