Skip to main content

La revisión del JPO endurece las solicitudes de patentes para MLLM

La lectura útil de la revisión de mitad de 2026 del Japan Patent Office (JPO) sobre invenciones relacionadas con IA no está en repetir que ahora se menciona de forma más explícita a los MLLM y a la IA generativa multimodal. El cambio práctico va más al fondo. Para los solicitantes, la revisión altera cómo debe redactarse la memoria, dónde conviene situar la contribución técnica y qué tipo de objeciones sobre actividad inventiva y suficiencia descriptiva pueden ganar peso en el examen.

La dirección tampoco llega de la nada. El JPO ya había añadido 10 nuevos casos de examen relacionados con IA en 2024, y su informe de marzo de 2026 sobre tendencias de invenciones relacionadas con IA amplió el foco hacia la IA generativa, la IA multimodal y la ingeniería de prompts. Leído en conjunto, el mensaje es bastante claro: en Japón pesa menos afirmar que un sistema usa un gran modelo y pesa más explicar qué problema técnico concreto resuelve de verdad la arquitectura multimodal o transmodal.

Inicia sesión para seguir leyendo

Regístrese gratis para acceder al análisis completo y a recomendaciones prácticas.

El punto más exigente no es la presencia de IA, sino dónde cae el efecto técnico

Durante años, muchas solicitudes de IA han descansado en una estructura demasiado conocida: datos de entrada, procesamiento por modelo y resultado de salida. Cuando el expediente entra en territorio MLLM, esa fórmula empieza a quedarse corta. Un sistema que combina texto, imagen, audio, vídeo o datos de sensores no se vuelve más patentable solo porque maneje más modalidades. Lo decisivo es si el solicitante puede mostrar que esa arquitectura mejora algo técnico de forma explicable y, a ser posible, medible.

Ahí es donde previsiblemente subirá la presión del examen. Es más probable que el examinador pregunte qué parte del flujo redujo latencia, mejoró precisión de emparejamiento, recortó falsos disparos, estabilizó la ejecución en el dispositivo, elevó la calidad de la recuperación o hizo más fiable el control aguas abajo. Dicho sin rodeos, “usamos un modelo multimodal potente” pesa poco por sí solo. “Esta organización transmodal produjo una mejora técnica concreta en un sistema, un dispositivo o una cadena de tratamiento” se parece bastante más a la respuesta que hará falta.

Muchas solicitudes de MLLM no fallan por el nombre del modelo, sino por una cadena operativa demasiado abstracta

Cada vez más expedientes suenan convincentes en la superficie porque usan el vocabulario correcto: modelos multimodales, vision-language models, retrieval-augmented generation, flujos agénticos. Pero en bastantes casos la cadena operativa sigue estando descrita de forma insuficiente. Cómo se alinean las distintas modalidades, cómo se estructura el prompt, cómo interactúan recuperación y generación, qué restricciones se aplican antes de ejecutar una acción o entregar una salida, y dónde entra la retroalimentación: todo eso ha dejado de ser mero adorno de redacción. Es precisamente donde pueden empezar a temblar la actividad inventiva y el soporte descriptivo.

Los casos añadidos por el JPO en 2024 ya dejaban ver una mirada más fina sobre actividad inventiva, requisitos descriptivos y patentabilidad de tecnologías relacionadas con IA. En el contexto MLLM, ese escrutinio probablemente será aún más concreto. Si una reivindicación solo enumera tratamiento de texto, imagen y audio, pero no explica por qué esas modalidades cooperan entre sí y no se limitan a coexistir, el expediente corre el riesgo de ser leído como una simple traslación de capacidades conocidas del modelo a un flujo ya existente.

La IA generativa transmodal elevará el coste real de divulgación

Esta es una de las consecuencias más prácticas de la revisión. Las solicitudes de una sola modalidad todavía pueden sostenerse a veces con una narración relativamente clásica de proceso software. En sistemas generativos transmodales, eso será cada vez menos suficiente. Habrá que describir con más detalle fuentes de entrada, lógica de alineación, estructuras de embeddings, gestión de restricciones, pasos de corrección, intervención humana, condiciones de despliegue y límites de recursos. Si no se hace, las reivindicaciones amplias sufrirán por soporte y suficiencia; las estrechas pueden dejar demasiado valor comercial fuera.

Además, aquí aparece una tensión que muchas empresas siguen subestimando. El know-how de verdad suele estar en la estructura del prompt, la limpieza de datos, las reglas de posprocesado, el orden de llamada a herramientas y el control de umbrales de seguridad, pero al presentar la solicitud se deja apenas un esquema alto nivel. En casos de MLLM, ese equilibrio sale más caro porque la implementación útil depende muchas veces de esos detalles intermedios. Si se reserva demasiado, el examen se vuelve más vulnerable. Si se revela demasiado, preocupa abrir en exceso la operativa interna. Eso obliga a una estrategia de solicitud en Japón más segmentada y menos dependiente de plantillas genéricas.

Ahora conviene repensar el despiece de reivindicaciones y el ritmo de examen en Japón

La cuestión ya no es solo si una invención basada en MLLM puede protegerse en Japón, sino cómo conviene dividirla. Una única solicitud que intente cubrir a la vez capacidades del modelo, casos de uso sectoriales, lógica de control en terminal y mecanismos de tratamiento de datos puede volverse difícil de sostener más adelante. En muchos supuestos, será más estable separar el mecanismo central de inferencia o alineación, la implementación sectorial concreta y la ejecución técnica conectada con hardware o control en distintas capas de protección. Así se conserva mejor el núcleo técnico y se deja más margen para examen y divisionales.

También importa el ritmo. Sería prudente no esperar a la primera acción oficial para empezar a preparar efectos medibles, realizaciones de respaldo y comparativas útiles. Los casos de MLLM e IA generativa transmodal son especialmente propensos a recibir preguntas como estas: por qué esto no es una optimización ordinaria, por qué la memoria no apoya suficientemente el alcance, o por qué el efecto alegado se queda en la calidad de salida y no llega al rendimiento del sistema. La señal de esta revisión del JPO no es que Japón cierre la puerta a las solicitudes de MLLM. La señal es otra: ya no bastará con nombres de modelo y diagramas de flujo.

通过 Email 接收最新资讯

El contenido de esta sección se ofrece únicamente con fines informativos y no constituye asesoramiento jurídico ni una recomendación formal de servicios. Para cualquier asunto concreto, le recomendamos considerar las circunstancias específicas de su caso y tomar como referencia la normativa, las políticas y la práctica más recientes de las autoridades competentes.