一、Milvus 是什么

Milvus 是一个面向 AI 时代海量向量数据的高性能、可扩展、云原生开源向量数据库。

它的核心价值是:

  • 专为向量检索设计;
  • 支持大规模向量存储和相似搜索;
  • 适合推荐系统、语义检索、多模态检索、RAG 等场景。

官网:

https://milvus.io/

GitHub:

https://github.com/milvus-io/milvus

二、实验环境说明

笔记里的演示环境基于 Ubuntu 22.04,实验环境配置大致为:

  • 2C2G 用于测试;
  • 生产环境按实际数据量和并发需求扩容。

三、安装 Docker 和 Docker Compose

apt update
apt install docker.io docker-compose -y

如果拉镜像慢,可以继续配置 Docker 加速器:

sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "registry-mirrors": [
    "https://docker.m.daocloud.io",
    "https://dockerhub.timeweb.cloud"
  ]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker

可以先用 busybox 测试 Docker 是否正常:

docker pull busybox

四、下载 Milvus 单机版配置

可以直接下载官方提供的单机版 Docker Compose 文件:

wget https://github.com/milvus-io/milvus/releases/download/v2.6.0-rc1/milvus-standalone-docker-compose.yml -O docker-compose.yml

如果你本地已经有现成的 Compose 文件,也可以直接用现有文件。

五、启动 Milvus

docker-compose up -d
docker-compose ps

启动后通常会看到几个核心容器:

  • milvus-etcd
  • milvus-minio
  • milvus-standalone

其中:

  • milvus-standalone 通常监听 19530
  • MinIO 会暴露对象存储相关端口;
  • etcd 主要用于内部元数据管理。

六、访问 WebUI

如果你在云主机上部署,需要先开放对应安全组端口,然后再访问:

http://<your-server-ip>:9091/webui/

公开文章里请始终使用占位写法,不要写真实公网 IP。

七、为什么 Milvus 很适合做 RAG 底座

因为它在“海量向量存储 + 高效相似检索”这两件事上做得足够专业。对于 RAG 来说,检索是第一步,Milvus 这种数据库的存在,就是为了把这一步做得更快、更稳。

八、部署层面的一个实用建议

如果你只是做实验,单机版就够了;如果要进入生产环境,再去考虑:

  • 数据规模;
  • 索引类型;
  • 集群部署;
  • 备份与监控。

先跑通最小可用版本,再逐步升级,是更稳妥的路线。