Why Metaphor Matters in NLP

Introduction

Do machines always know how to listen? They can autocomplete a sentence, summarise a news article, even generate poetry. When language stretches beyond the literal into the figurative, systems begin to falter. This blind spot matters because metaphor is where lived experience becomes visible.

Work across linguistics and psychology has shown that metaphor is part of cognition, not decoration. Lakoff and Johnson described how metaphor structures thought. Gibbs examined figurative processing in everyday understanding. In health communication, Elena Semino and colleagues explored how images of battle or journey influence how people talk about illness and how clinicians respond. Computationally, resources such as the VU Amsterdam Metaphor Corpus and evaluations in SemEval have pushed detection and interpretation. These traditions highlight both pervasiveness and modelling difficulty.

This article builds on that research and adds a practical dimension, asking what happens when a linguist becomes a developer and designs tools that take metaphor seriously.

What metaphor reveals

Metaphor is a way of making experience graspable when literal words fall short. In clinical communication, a person who says “it feels like barbed wire around my spine” is trying to convey constriction, sharpness, and persistent discomfort. Someone describing asthma as “a fist closing inside my lungs” communicates suffocation and panic more vividly than a numeric scale. Metaphor turns the intangible into something shareable. If NLP overlooks this language, it overlooks signals that matter for care.

Where metaphor affects NLP tasks

Ignoring metaphor is not neutral. It undermines core applications and weakens outcomes.

Sentiment and emotion analysis. Figurative wording often signals heightened affect. If a system treats “a storm in my head” as weather talk, it will miss distress or agitation.
Information extraction. Symptoms and attributes often appear through imagery, not only keywords. “It burns like fire” encodes temperature and sensation without naming fever or heat.
Summarisation. A good summary preserves experiential meaning, not only clinical facts. Stripping metaphor risks flattening the person’s voice.
Classification and triage. Risk assessment improves when metaphor is treated as evidence. “Like knives twisting” can indicate severity more clearly than a number on a scale.
Search and retrieval. Conceptual normalisation enables better matches. A system should connect “crushing weight on my chest” with “chest pressure” even if the words differ.

How linguistics can guide better models

Linguistics offers tools that make metaphor interpretable rather than opaque.

Taxonomies. Metaphors cluster into families such as heat, intrusion, force, predation, container, and weight. Grouping them helps models generalise beyond single phrases.
Patterns and cues. Certain verbs, nouns, and constructions reliably flag figurative usage. Collecting them creates rule based anchors for detection.
Pragmatics. Who is speaking, to whom, and with what purpose matters. Figurative choices differ in a consultation, a private message, or a public forum.
Appraisal and stance. Boosters, hedges, and evaluations calibrate intensity and certainty. “It is unbearable” signals more urgency than “it is uncomfortable.”
Cross register variation. Communities differ in figurative choices. Dialect, age group, and professional background all influence which metaphors feel natural.

From research to tooling

These principles are not only theoretical. We translated them into a compact prototype: a metaphor tagger and a small web application. The goal was not poetic analysis but practical communication, hearing what a person tries to say and producing outputs useful to both patient and clinician.

To make this possible we designed a stack and workflow that turn linguistic principles into a functioning system.

Stack

Python handles text processing, spaCy provides tokenisation and lemmatisation, curated regex deliver high precision pattern matching, and a taxonomy stored in JSON keeps categories maintainable. Flask serves an API and a simple interface. Small Transformer components are added only when disambiguation requires extra context.

Pipeline

Input text is normalised and segmented. Regex and lexicon rules propose metaphor candidates and attach labels from the taxonomy. Context windows are passed to a light classifier when needed. Each candidate is linked to experiential hints and to plain clinical paraphrases. The system produces two summaries, one written for the patient and another written for the clinician, both printable and ready for consultation.

Why hybrid rules help

Rules make decisions interpretable and keep false positives low. They provide transparency about why an expression was tagged. The classifier resolves boundary cases and register shifts that rules alone cannot capture. The combination provides speed, clarity, and enough flexibility to work across speakers and contexts.

Conclusion

Figurative language is not a problem to correct. It is a resource to understand. In healthcare communication, metaphors carry clues about pain, urgency, and emotion that are too important to ignore. When NLP treats metaphor as signal, summaries become more faithful, extraction becomes more complete, and recommendations become more humane.

Linguistics brings models closer to meaning by making patterns explicit, embedding pragmatics, and honouring variation. Tools like a metaphor tagger and communication focused apps show how this integration works in practice. They show that machines can be taught not only to parse words but to listen for what lies behind them. If we want NLP to support care, mental health, education, and other domains where human stakes are high, we need systems that take figurative language seriously. Humane technology begins by listening first and processing second.

Introducción

¿Las máquinas siempre saben escuchar? Pueden autocompletar una frase, resumir una noticia, incluso generar poesía. Cuando el lenguaje se aleja de lo literal y entra en lo figurado, los sistemas empiezan a fallar. Ese punto ciego importa porque la metáfora es el lugar donde la experiencia vivida se vuelve visible.

La investigación en lingüística y psicología ha mostrado que la metáfora forma parte de la cognición. Lakoff y Johnson explicaron cómo la metáfora estructura el pensamiento. Gibbs estudió el procesamiento figurado en la comprensión cotidiana. En comunicación en salud, Elena Semino y colegas analizaron cómo imágenes como batalla o viaje influyen en la manera de hablar sobre la enfermedad y en la respuesta clínica. En el plano computacional, recursos como el VU Amsterdam Metaphor Corpus y las evaluaciones en SemEval han impulsado la detección y la interpretación. Estos trabajos evidencian la amplitud del fenómeno y la dificultad de modelarlo.

Este artículo se apoya en ese marco y añade una dimensión práctica, la de lo que ocurre cuando una lingüista se convierte en desarrolladora y diseña herramientas que toman la metáfora en serio.

Lo que la metáfora revela

La metáfora permite hacer comunicable lo que no se puede decir con palabras literales. En una consulta, quien dice “siento como si tuviera alambre de púas alrededor de la columna” intenta expresar constricción, punzadas y persistencia. Quien describe el asma como “un puño que se cierra dentro de los pulmones” comunica asfixia y pánico con más claridad que una escala numérica. La metáfora vuelve compartible lo intangible. Si el PLN ignora este lenguaje, ignora señales que importan para la atención.

Dónde afecta la metáfora a las tareas de PLN

Ignorar la metáfora no es neutral. Debilita aplicaciones clave y empeora resultados.

Sentimiento y emoción. El lenguaje figurado suele señalar mayor intensidad. Si un sistema toma “una tormenta en mi cabeza” como meteorología, pasará por alto angustia o agitación.
Extracción de información. Los síntomas y sus atributos aparecen a menudo mediante imágenes y no solo palabras clave. “Quema como fuego” codifica temperatura y sensación sin nombrar fiebre o calor.
Resumen. Un buen resumen conserva el significado experiencial y no solo los hechos. Borrar la metáfora aplanará la voz de la persona.
Clasificación y triaje. La evaluación del riesgo mejora cuando la metáfora se trata como evidencia. “Como cuchillos que giran” puede indicar gravedad con más claridad que un número.
Búsqueda y recuperación. La normalización conceptual permite mejores coincidencias. Un sistema debería vincular “un peso que aplasta el pecho” con “opresión torácica” aunque las palabras difieran.

Cómo la lingüística puede guiar mejores modelos

La lingüística ofrece herramientas para que la metáfora sea interpretable y no opaca.

Taxonomías. Las metáforas se agrupan en familias como calor, intrusión, fuerza, depredación, contenedor y peso. Agrupar ayuda a generalizar más allá de cada frase.
Patrones y pistas. Ciertos verbos, sustantivos y construcciones señalan con fiabilidad el uso figurado. Recopilarlos crea anclajes de reglas para la detección.
Pragmática. Importa quién habla, a quién y con qué objetivo. Las elecciones figuradas difieren en una consulta, en un mensaje privado o en un foro público.
Valoración y postura. Refuerzos, atenuadores y evaluaciones calibran intensidad y certeza. “Es insoportable” expresa más urgencia que “es molesto”.
Variación por registro. Las comunidades difieren en sus elecciones figuradas. El dialecto, la edad y la formación influyen en qué metáforas resultan naturales.

De la investigación a las herramientas

Estos principios no son solo teóricos. Los llevamos a un prototipo compacto, un etiquetador de metáforas y una aplicación web sencilla. El objetivo no es analizar poesía sino facilitar la comunicación, escuchar lo que la persona intenta decir y producir salidas útiles tanto para paciente como para profesional.

Para lograrlo diseñamos una pila tecnológica y un flujo de trabajo que convierten los principios lingüísticos en un sistema operativo.

Tecnología

Python gestiona el procesamiento de texto, spaCy aporta tokenización y lematización, expresiones regulares curadas ofrecen patrones de alta precisión y una taxonomía en JSON mantiene las categorías. Flask sirve una API y una interfaz sencilla. Módulos pequeños de Transformers se añaden solo cuando la desambiguación requiere más contexto.

Flujo

El texto de entrada se normaliza y segmenta. Las reglas con expresiones regulares y el léxico proponen candidatos metafóricos y asignan etiquetas de la taxonomía. Ventanas de contexto se envían a un clasificador ligero cuando hace falta. Cada candidato se enriquece con pistas experienciales y con paráfrasis clínicas claras. El sistema produce dos resúmenes, uno para la persona en lenguaje accesible y otro para profesionales en lenguaje médico sencillo, ambos listos para impresión y uso en consulta.

Por qué ayudan los enfoques híbridos

Las reglas hacen que las decisiones sean interpretables y reducen falsos positivos. Dan transparencia sobre por qué se etiquetó una expresión. El clasificador resuelve casos límite y cambios de registro que las reglas no capturan. La combinación aporta rapidez, claridad y suficiente flexibilidad para funcionar con distintos hablantes y contextos.

Conclusión

El lenguaje figurado no es un problema que haya que corregir. Es un recurso que hay que comprender. En comunicación sanitaria, las metáforas contienen pistas sobre dolor, urgencia y emoción que no conviene pasar por alto. Cuando el PLN trata la metáfora como señal, los resúmenes ganan fidelidad, la extracción se vuelve más completa y las recomendaciones más humanas.

La lingüística acerca los modelos al significado al explicitar patrones, incorporar pragmática y respetar la variación. Herramientas como un etiquetador de metáforas y aplicaciones orientadas a la comunicación muestran cómo funciona en la práctica esta integración. Demuestran que las máquinas pueden aprender no solo a analizar palabras sino a escuchar lo que hay detrás. Si queremos que el PLN apoye la atención, la salud mental, la educación y otros ámbitos con alta implicación humana, necesitamos sistemas que tomen en serio el lenguaje figurado. La tecnología humana empieza por escuchar primero y procesar después.