加载中...
Google的Turbo Quant确实不错啊,最新Qwen3.5 9B模型也能在老的M1 MacbookPro 16GB上跑起来。
4k context 模式下总共占用了5.9GB内存, 节省了差不多一半。