Apple ha trabajado en una familia de modelos de lenguaje de gran tamaño multimodal (MLLM, por sus siglas en ingles) denominada MM1, que demuestra tener capacidad de razonar en una cadena de pensamiento de pocas indicaciones para el aprendizaje de texto y el razonamiento de múltiples imágenes.