注意:这是一个轻微的失修状态,不能保证下面的说明正常工作。
在终端中运行 reporec 的演示
$ python reporec.py
不幸的是,我无法避免对 mongo 的依赖:(
因为完整的数据库太大而无法压缩,并且从 GHTorrent 下载需要很长时间,我将数据样本作为 json 文件包含在内,该文件将在 reporec.py 的主要函数中解析为 python。 但是 minhash 需要 mongo。
要将 n 个最新的 Watchers 数据集下载并加载到 mongo 中,请运行
$ https://blog.csdn.net/gitblog_00837/article/details/download_data n
其中 n 是整数。 每个数据集大约是 2 个月的数据。
您还可以通过运行导出 userToRepos 数据
$ https://blog.csdn.net/gitblog_00837/article/details/export_user_to_repos.sh
到此这篇国内github镜像网站(githubusercontent镜像)的文章就介绍到这了,更多相关内容请继续浏览下面的相关 推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/rfx/48863.html