快速安全可靠:企业级LLM推理 2024年3月20日 通过 林登里, Jeffrey Chen, Megha Agarwal, 玛格丽特钱并 达亚库迪亚 内 Mosaic研究 创世纪2023年开发后 多家企业急切想 采用能力越强的人工智能模型
NVIDIA TensorRT-LLM集成数据bricks推理栈 2023年12月21日 通过 林登里, Megha Agarwal, 科比克劳福德并 达亚库迪亚 内 Mosaic研究 近六个月来,我们一直和NVIDIA合作 以从新TensorRT-LLM库中获取最大值TensorRT-LLM提供易用Python接口与Web服务器整合,快速高效推理LLM文章中强调一些关键领域 内华达协作特别重要
LLM推理性能工程:最佳做法 2023年10月12日 通过 Megha Agarwal, asfandyar库雷希, 尼基尔沙尔达, 林登里, Julian队列并 达亚库迪亚 内 Mosaic研究 bob下载地址MosaicML工程团队分享最佳实践, 使用广受欢迎的开源大语言模型