Разбиране на четириграмовите единици в езика и лингвистиката
Четириграма е термин, използван в лингвистиката за обозначаване на група от четири думи, които заедно образуват езикова единица, като фраза или изречение. Концепцията за четириграма е въведена от лингвиста Уилям Крофт през 90-те години на миналия век и оттогава е широко възприета в областта на корпусната лингвистика.
Идеята зад четириграмата е, че езикът често е структуриран около групи от четири думи , а не около отделни думи или по-големи единици като изречения. Например в изречението „Котката подгони мишката“ четирите грама са „котката подгони“. Тази единица съдържа четири думи и функционира като единична смислова единица в рамките на изречението.
Четири грама са важни в лингвистиката, защото могат да ни помогнат да разберем как е структуриран езикът и как се предава значението. Чрез анализиране на честотата и разпространението на четириграма в корпус от текст, изследователите могат да получат представа за моделите и структурите на използване на езика. Освен това концепцията за четирите грама е била използвана за разработване на нови методи за анализ на езикови данни, като четириграмовия модел на структурата на изречението.