Data Taxonomy for Pain Language
~5–6 min · Updated Sep 2025
Introduction
Pain is often described in messy, unpredictable ways. A patient might say “it burns here,” “it feels like a hammer,” or “my back screams at night.” These expressions are clinically meaningful, yet without a structure they are difficult to compare, tag, or process.
This article presents a compact data taxonomy for pain language, built from my academic linguistic research in the Language of Endometriosis Project. Working directly with patient narratives revealed recurring patterns that annotators can label consistently and developers can map into tools like the prototype pain tagger and the Explain My Pain app.
What is a taxonomy
In annotation, a taxonomy is a “menu” of categories. Instead of asking “what do I feel this means?”, annotators choose from clearly defined options. This reduces confusion, improves agreement, and enables downstream computation.
Why keep it compact
Oversized schemas slow teams and reduce consistency. For pain language, I deliberately kept the taxonomy small and practical—broad enough to capture variety, specific enough to be recognized quickly.
- Less training time for new annotators
- Fewer disagreements and easier QA
- Stronger foundations for prototypes and NLP pipelines
The categories
Illustrated with examples from the Language of Endometriosis corpus.
1) Pain qualities
What the pain feels like: burning, stabbing, throbbing, dull.
Example: “It feels like a burning rope around my stomach.”
2) Body location
Where pain occurs: womb, lower back, knee, stomach.
Example: “A sharp pain in my lower back.”
3) Intensity markers
How strong it is: mild, severe, unbearable, very.
Example: “It’s unbearable every morning.”
4) Figurative or metaphorical language
Comparisons to other domains: knife, hammer, beast, fire.
Example: “It’s as if someone is stabbing me with a knife.”
5) Temporal markers
When it happens or changes: constant, comes and goes, at night, before period.
Example: “The cramps come and go, but always return before my period.”
Entailments in metaphorical pain language
Beyond tagging metaphors, we can capture their entailments—the logical consequences a metaphor implies. In the Language of Endometriosis data, metaphors structured how patients understood and lived their pain.
Metaphor type | Example | Entailments |
Violence / Attack |
“Like being stabbed with a knife.” |
External agent; patient as victim; aggression; relentlessness. |
Weight / Pressure |
“A heavy rock pressing on my pelvis.” |
Constancy; immobilization; oppression; limited movement. |
Animal |
“A beast clawing at my womb.” |
Unpredictability; lack of control; hostility; ‘alive’ pain. |
Heat / Fire |
“Flames burning through my abdomen.” |
Escalation; spread; destruction; consuming quality. |
Containment / Trapping |
“Being locked in a burning cage.” |
Restriction; enclosure; no escape; surrounding pain. |
Entailments add conceptual depth for analysis and can be mapped to higher-level “pain profiles” in the pain tagger and the app.
Relations
- Intensity modifies a quality: “sharp pain.”
- Location grounds a metaphor: “a burning knife in my knee.”
- Temporal shifts intensity: “worse at night.”
In the Endometriosis data, metaphors often co-occurred with location and intensity; capturing relations keeps the representation faithful to patient speech.
Why this matters
For annotators: a trainable, testable menu. For recruiters: lean design scales better and lowers costs. For developers: a bridge from narrative to features that power the tagger and the app.
Closing
This compact taxonomy is a foundation. Next in the series: Lightweight QA & Sampling, the Metaphor to Measurement case study, and a toolkit of Annotation Snippets & Prompts.
Taxonomía de datos para el lenguaje del dolor
~5–6 min · Actualizado Sep 2025
Introducción
El dolor suele describirse de formas desordenadas e imprevisibles. Una persona puede decir “acá quema”, “se siente como un martillo” o “la espalda me grita de noche”. Estas expresiones son significativas, pero sin una estructura resultan difíciles de comparar, etiquetar o procesar.
Este artículo presenta una taxonomía de datos compacta para el lenguaje del dolor, construida a partir de mi investigación lingüística en el proyecto Language of Endometriosis. Trabajar con narrativas de pacientes permitió identificar patrones recurrentes que las personas anotadoras pueden marcar con consistencia y que las personas desarrolladoras pueden mapear a herramientas como el prototipo de tagger de dolor y la app Explain My Pain.
Qué es una taxonomía
En anotación, una taxonomía es un “menú” de categorías. En lugar de preguntar “¿qué creo que significa?”, la persona anotadora elige entre opciones definidas. Eso reduce la confusión, mejora el acuerdo y habilita el uso computacional.
Por qué mantenerla compacta
Los esquemas sobredimensionados enlentecen a los equipos y bajan la consistencia. Para el lenguaje del dolor, mantuve la taxonomía pequeña y práctica: lo bastante amplia para captar variedad y lo bastante específica para reconocerla rápido.
- Menos tiempo de formación para nuevas personas anotadoras
- Menos desacuerdos y QA más simple
- Base más sólida para prototipos y pipelines de PLN
Las categorías
Con ejemplos del corpus de Language of Endometriosis.
1) Cualidades del dolor
Cómo se siente: urente/que quema, punzante, palpitante, sordo.
Ejemplo: “Se siente como una cuerda ardiendo alrededor del estómago”.
2) Ubicación en el cuerpo
Dónde ocurre: útero, zona lumbar, rodilla, estómago.
Ejemplo: “Un dolor agudo en la zona lumbar”.
3) Marcadores de intensidad
Qué tan fuerte es: leve, severo, insoportable, muy.
Ejemplo: “Es insoportable cada mañana”.
4) Lenguaje figurado o metafórico
Comparaciones con otros dominios: cuchillo, martillo, bestia, fuego.
Ejemplo: “Es como si alguien me apuñalara con un cuchillo”.
5) Marcadores temporales
Cuándo ocurre o cambia: constante, va y viene, de noche, antes del período.
Ejemplo: “Los cólicos van y vienen, pero siempre vuelven antes del período”.
Entailments en el lenguaje metafórico del dolor
Además de etiquetar metáforas, podemos capturar sus entailments (consecuencias lógicas). En los datos de Endometriosis, las metáforas estructuraron cómo las pacientes comprendieron y vivieron el dolor.
Tipo de metáfora | Ejemplo | Entailments |
Violencia / Ataque |
“Como si me apuñalaran con un cuchillo”. |
Agente externo; paciente-víctima; agresión; carácter implacable. |
Peso / Presión |
“Una piedra pesada presionando la pelvis”. |
Constancia; inmovilización; opresión; movimiento limitado. |
Animal |
“Una bestia que me araña el útero”. |
Imprevisibilidad; falta de control; hostilidad; dolor “vivo”. |
Calor / Fuego |
“Llamas que atraviesan el abdomen”. |
Escalada; propagación; destrucción; cualidad que consume. |
Encierro / Trampa |
“Estar encerrada en una jaula ardiente”. |
Restricción; encierro; sin escape; dolor envolvente. |
Los entailments aportan profundidad conceptual para el análisis y pueden mapearse a “perfiles de dolor” de mayor nivel en el tagger y la app.
Relaciones
- La intensidad modifica una cualidad: “dolor agudo”.
- La ubicación ancla la metáfora: “un cuchillo ardiente en la rodilla”.
- Lo temporal modula la intensidad: “peor de noche”.
En los datos de Endometriosis, las metáforas co-ocurrieron a menudo con ubicación e intensidad; capturar relaciones mantiene fiel la representación al habla de las pacientes.
Por qué importa
Para anotadoras/es: un menú entrenable y evaluable. Para recruiters: un diseño lean escala mejor y reduce costos. Para desarrolladoras/es: un puente del relato a las features que alimentan el tagger y la app.
Cierre
Esta taxonomía compacta es una base. Siguiente en la serie: QA y muestreo livianos, el caso Metáfora → Medición, y el kit de Fragmentos y prompts de anotación.