INFO:
双4090部署qwen72b大模型 每秒150tokens