Case Studies

Annotation in Practice: Two Mini Case Studies

Two concise, real-world annotation examples with token level decisions and clear guideline rationale.

Sep 2025

Annotation quality depends on more than abstract understanding. It lives in the decisions we make token by token. These short examples show how I apply guidelines, document edge cases, and balance consistency with context.

Case Study 1, Pain Descriptor Labelling

Raw text:

“It feels like burning needles.”

Annotation

Metaphor based scheme
- burning → pain: metaphor/heat
- needles → pain: metaphor/sharp-object
Clinical scheme
- whole phrase → pain: neuropathic

Commentary, I use a dual layer approach to reconcile priorities from metaphor research, medical literature, and annotator usability. Decisions are logged in a shared sheet with definitions and examples so others can apply categories consistently.

Case Study 2, Speech Data Verification

Transcript (audio)

I’m gonna get it.

Model output

I am going to get it.

Annotation

I’m → I am → correct (acceptable normalisation)
gonna → going to → correct (acceptable normalisation)

Commentary, I mark normalisations as correct when they preserve meaning and follow the guideline. If a model inserts words not spoken or erases dialect features, I mark error: hallucination or error: bias and log a note for error analysis.

Want the quantitative side, see my companion piece, Measuring Annotation Quality, A Mini Evaluation Project.

Estudios de caso

Anotación en la práctica, dos mini estudios de caso

Dos ejemplos concisos y reales, con decisiones a nivel de token y la justificación de las guías.

Sep 2025

La calidad de la anotación no es solo conceptual. Se decide token por token. Estos ejemplos muestran cómo aplico las guías, documento casos límite y equilibro consistencia y contexto.

Estudio de caso 1, etiquetado de descriptores de dolor

Texto original:

“Se siente como agujas que queman.”

Anotación

Esquema basado en metáfora
- queman → dolor: metáfora/calor
- agujas → dolor: metáfora/objeto-punzante
Esquema clínico
- frase completa → dolor: neuropático

Comentario, uso una capa doble para conciliar las prioridades de la investigación en metáfora, la literatura médica y la usabilidad de quienes anotan. Registro decisiones en una hoja compartida con definiciones y ejemplos, así promovemos una aplicación consistente.

Estudio de caso 2, verificación de datos de habla

Transcripción (audio)

Voy a agarrarlo.

Salida del modelo

Lo voy a tomar.

Anotación

agarrarlo → tomar → correcto (normalización aceptable si la guía lo permite)

Comentario, marco normalizaciones como correctas cuando preservan el significado y siguen la guía. Si el modelo inserta palabras no dichas o borra rasgos dialectales, marco error: alucinación o error: sesgo y dejo registro para análisis de error.

Para la parte cuantitativa, ver la pieza complementaria, Cómo medir la calidad de la anotación, un mini proyecto de evaluación.