Data Taxonomy for Pain Language

~5–6 min · Updated Sep 2025

Introduction

Pain is often described in messy, unpredictable ways. A patient might say “it burns here,” “it feels like a hammer,” or “my back screams at night.” These expressions are clinically meaningful, yet without a structure they are difficult to compare, tag, or process.

This article presents a compact data taxonomy for pain language, built from my academic linguistic research in the Language of Endometriosis Project. Working directly with patient narratives revealed recurring patterns that annotators can label consistently and developers can map into tools like the prototype pain tagger and the Explain My Pain app.

What is a taxonomy

In annotation, a taxonomy is a “menu” of categories. Instead of asking “what do I feel this means?”, annotators choose from clearly defined options. This reduces confusion, improves agreement, and enables downstream computation.

Why keep it compact

Oversized schemas slow teams and reduce consistency. For pain language, I deliberately kept the taxonomy small and practical—broad enough to capture variety, specific enough to be recognized quickly.

Less training time for new annotators
Fewer disagreements and easier QA
Stronger foundations for prototypes and NLP pipelines

The categories

Illustrated with examples from the Language of Endometriosis corpus.

1) Pain qualities

What the pain feels like: burning, stabbing, throbbing, dull.
Example: “It feels like a burning rope around my stomach.”

2) Body location

Where pain occurs: womb, lower back, knee, stomach.
Example: “A sharp pain in my lower back.”

3) Intensity markers

How strong it is: mild, severe, unbearable, very.
Example: “It’s unbearable every morning.”

4) Figurative or metaphorical language

Comparisons to other domains: knife, hammer, beast, fire.
Example: “It’s as if someone is stabbing me with a knife.”

5) Temporal markers

When it happens or changes: constant, comes and goes, at night, before period.
Example: “The cramps come and go, but always return before my period.”

Entailments in metaphorical pain language

Beyond tagging metaphors, we can capture their entailments—the logical consequences a metaphor implies. In the Language of Endometriosis data, metaphors structured how patients understood and lived their pain.

Metaphor type	Example	Entailments
Violence / Attack	“Like being stabbed with a knife.”	External agent; patient as victim; aggression; relentlessness.
Weight / Pressure	“A heavy rock pressing on my pelvis.”	Constancy; immobilization; oppression; limited movement.
Animal	“A beast clawing at my womb.”	Unpredictability; lack of control; hostility; ‘alive’ pain.
Heat / Fire	“Flames burning through my abdomen.”	Escalation; spread; destruction; consuming quality.
Containment / Trapping	“Being locked in a burning cage.”	Restriction; enclosure; no escape; surrounding pain.

Entailments add conceptual depth for analysis and can be mapped to higher-level “pain profiles” in the pain tagger and the app.

Relations

Intensity modifies a quality: “sharp pain.”
Location grounds a metaphor: “a burning knife in my knee.”
Temporal shifts intensity: “worse at night.”

In the Endometriosis data, metaphors often co-occurred with location and intensity; capturing relations keeps the representation faithful to patient speech.

Why this matters

For annotators: a trainable, testable menu. For recruiters: lean design scales better and lowers costs. For developers: a bridge from narrative to features that power the tagger and the app.

Closing

This compact taxonomy is a foundation. Next in the series: Lightweight QA & Sampling, the Metaphor to Measurement case study, and a toolkit of Annotation Snippets & Prompts.

Taxonomía de datos para el lenguaje del dolor

~5–6 min · Actualizado Sep 2025

Introducción

El dolor suele describirse de formas desordenadas e imprevisibles. Una persona puede decir “acá quema”, “se siente como un martillo” o “la espalda me grita de noche”. Estas expresiones son significativas, pero sin una estructura resultan difíciles de comparar, etiquetar o procesar.

Este artículo presenta una taxonomía de datos compacta para el lenguaje del dolor, construida a partir de mi investigación lingüística en el proyecto Language of Endometriosis. Trabajar con narrativas de pacientes permitió identificar patrones recurrentes que las personas anotadoras pueden marcar con consistencia y que las personas desarrolladoras pueden mapear a herramientas como el prototipo de tagger de dolor y la app Explain My Pain.

Qué es una taxonomía

En anotación, una taxonomía es un “menú” de categorías. En lugar de preguntar “¿qué creo que significa?”, la persona anotadora elige entre opciones definidas. Eso reduce la confusión, mejora el acuerdo y habilita el uso computacional.

Por qué mantenerla compacta

Los esquemas sobredimensionados enlentecen a los equipos y bajan la consistencia. Para el lenguaje del dolor, mantuve la taxonomía pequeña y práctica: lo bastante amplia para captar variedad y lo bastante específica para reconocerla rápido.

Menos tiempo de formación para nuevas personas anotadoras
Menos desacuerdos y QA más simple
Base más sólida para prototipos y pipelines de PLN

Las categorías

Con ejemplos del corpus de Language of Endometriosis.

1) Cualidades del dolor

Cómo se siente: urente/que quema, punzante, palpitante, sordo.
Ejemplo: “Se siente como una cuerda ardiendo alrededor del estómago”.

2) Ubicación en el cuerpo

Dónde ocurre: útero, zona lumbar, rodilla, estómago.
Ejemplo: “Un dolor agudo en la zona lumbar”.

3) Marcadores de intensidad

Qué tan fuerte es: leve, severo, insoportable, muy.
Ejemplo: “Es insoportable cada mañana”.

4) Lenguaje figurado o metafórico

Comparaciones con otros dominios: cuchillo, martillo, bestia, fuego.
Ejemplo: “Es como si alguien me apuñalara con un cuchillo”.

5) Marcadores temporales

Cuándo ocurre o cambia: constante, va y viene, de noche, antes del período.
Ejemplo: “Los cólicos van y vienen, pero siempre vuelven antes del período”.

Entailments en el lenguaje metafórico del dolor

Además de etiquetar metáforas, podemos capturar sus entailments (consecuencias lógicas). En los datos de Endometriosis, las metáforas estructuraron cómo las pacientes comprendieron y vivieron el dolor.

Tipo de metáfora	Ejemplo	Entailments
Violencia / Ataque	“Como si me apuñalaran con un cuchillo”.	Agente externo; paciente-víctima; agresión; carácter implacable.
Peso / Presión	“Una piedra pesada presionando la pelvis”.	Constancia; inmovilización; opresión; movimiento limitado.
Animal	“Una bestia que me araña el útero”.	Imprevisibilidad; falta de control; hostilidad; dolor “vivo”.
Calor / Fuego	“Llamas que atraviesan el abdomen”.	Escalada; propagación; destrucción; cualidad que consume.
Encierro / Trampa	“Estar encerrada en una jaula ardiente”.	Restricción; encierro; sin escape; dolor envolvente.

Los entailments aportan profundidad conceptual para el análisis y pueden mapearse a “perfiles de dolor” de mayor nivel en el tagger y la app.

Relaciones

La intensidad modifica una cualidad: “dolor agudo”.
La ubicación ancla la metáfora: “un cuchillo ardiente en la rodilla”.
Lo temporal modula la intensidad: “peor de noche”.

En los datos de Endometriosis, las metáforas co-ocurrieron a menudo con ubicación e intensidad; capturar relaciones mantiene fiel la representación al habla de las pacientes.

Por qué importa

Para anotadoras/es: un menú entrenable y evaluable. Para recruiters: un diseño lean escala mejor y reduce costos. Para desarrolladoras/es: un puente del relato a las features que alimentan el tagger y la app.

Cierre

Esta taxonomía compacta es una base. Siguiente en la serie: QA y muestreo livianos, el caso Metáfora → Medición, y el kit de Fragmentos y prompts de anotación.