加载中...
这次 Gemma 的全系列都在多模态上下了大功夫,原生自带语音转录翻译、视频理解。 E2B 和 E4B 模型本身只有 2.3B 和 4.5B(Effectively),但是带上 embedding 就要 5B 和 8B 了 而 31B dense 和 26B4A MoE 基本上可以横向比较,感觉有条件还是上 Dense 吧。
这次可以期待移动端端侧的多模态体验了