背景:10亿(Billion级别)的数据应该是一个很大的数据了,尤其是维度在768+级别(还有1024,1536等),这个数据量我做了一个实验,shape为(1kw,768)的array(numpy)占内存为30G(float32格式),如果能降低为float16更好不过,但似乎faiss没有这种方法或者精度有所损失。
那么对于5亿级别的数据(vectors),占内存则为1500G,我相信目前似乎没有这么大的机器,我只见过500G,700G,甚至900G的机器,而且是8卡GPU的服务器才有的内存。这已经超出了一般的数据量了。
当然也可采用ES集群部署,但是感觉有点费资源。维护也是需要的,可能会宕机。
愿我们终有重逢之时,而你还记得我们曾经讨论的话题。
Q group
Q second group
下面是代码分享:
到此这篇faiss数据库(faiss数据库安装)的文章就 介绍到这了,更多相关内容请继续浏览下面的相关 推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/rgzn-aibigd/46975.html