Bilgisayarlar sınavları gerçekten işaretleyebilir mi? ELT otomatik değerlendirmelerinin avantajları

ɫèAV Languages
Sembollerle bir dizüstü bilgisayarda yazan eller

Yapay Zeka (AI) kullanımı da dahil olmak üzere otomatik değerlendirme, en yeni eğitim teknolojisi çözümlerinden biridir. Sınav işaretleme sürelerini hızlandırır, insan önyargılarını ortadan kaldırır ve en az insan sınav görevlileri kadar doğru ve güvenilirdir. Yenilikler devam ettikçe, bu öğretmenler ve öğrenciler için gerçek bir oyun değiştiricidir.

Bununla birlikte, anlaşılır bir şekilde ELT topluluğunda birçok soru ve bazen şüpheyle karşılandı - bilgisayarlar konuşma ve yazma sınavlarını gerçekten doğru bir şekilde işaretleyebilir mi?

Cevap kocaman bir evet. Dünyanın her yerinden öğrenciler zaten yapay zeka dereceli sınavlara giriyor. ve VersantÌýsınavları, sınava girenlerin nerede yaÅŸadıklarına veya aksanlarının veya cinsiyetlerinin ne olduÄŸuna bakılmaksızın konuÅŸma ve yazma sınavları için tarafsız, adil ve hızlı otomatik puanlama saÄŸlar.

Bu makale, yapay zeka otomatik puanlamasında yer alan ana süreçleri açıklayacak ve yapay zeka teknolojilerinin tutarlı uzman insan yargılarının temelleri üzerine inşa edildiğine dikkat çekecektir. Öyleyse, otomatik puanlama ve yapay zeka konusundaki kafa karışıklığını giderelim ve hem öğretmenlere hem de öğrencilere nasıl yardımcı olabileceğini inceleyelim.

Yapay zeka ve geleneksel otomatik puanlama

Her şeyden önce, geleneksel otomatik puanlama ile yapay zeka arasında ayrım yapalım. Otomatik puanlama hakkında konuştuğumuzda, genellikle, çoktan seçmeli veya cloze öğeleri olan öğeleri puanlamayı kastediyoruz. Cümleleri yeniden sıralamanız, açılır listeden seçim yapmanız, eksik bir kelimeyi eklemeniz gerekebilir - bu tür şeyler. Bu soru türleri, belirli becerileri test etmek için tasarlanmıştır ve otomatik puanlama, her seferinde hızlı ve doğru bir şekilde işaretlenebilmelerini sağlar.

Bunun gibi otomatik olarak puanlanan öğeler, dinleme ve okuduğunu anlama gibi alıcı becerileri değerlendirmek için kullanılabilirken, yazma ve konuşmanın üretken becerilerini işaretleyemezler. Her öğrencinin yazılı ve sözlü öğelerdeki tepkisi farklı olacaktır, peki bilgisayarlar bunları nasıl işaretleyebilir?

Yapay zekanın devreye girdiği yer burasıdır.

Yapay zekanın, örneğin tıbbi teşhiste olduğu gibi, büyük miktarda yapılandırılmamış veriyle etkili ve %100 doğru bir şekilde başa çıkmaya ihtiyaç duyulan alanlarda nasıl giderek daha fazla kullanıldığı hakkında çok şey duyuyoruz. Dil testinde AI, yazılı ve sözlü testleri derecelendirmek için özel bilgisayar yazılımı kullanır.

Yapay zeka, konuşma sınavlarını puanlamak için nasıl kullanılır?

İlk adım, her dil için konuşmayı tanıyabilen ve onu dalga biçimlerine ve metne dönüştürebilen bir akustik model oluşturmaktır. Bu teknoloji eskiden çok sıra dışı olsa da, akıllı telefonlarımızın çoğu artık bunu yapabiliyor.

Bu akustik modeller daha sonra bir testteki her bir istemi veya öğeyi puanlamak için eğitilir. Bunu, önce öğeleri puanlamak için çift işaretleme kullanarak insan uzman puanlayıcıları kullanarak yapıyoruz. Her madde için yüzlerce sözlü yanıt alırlar ve bu 'Standartlar' daha sonra motoru eğitmek için kullanılır.

Daha sonra, insan tarafından işaretlenmiş çok daha fazla öğeyi besleyerek eğitilmiş motoru doğrularız ve makine puanlarının insan puanlarıyla çok yüksek oranda ilişkili olup olmadığını kontrol ederiz. Herhangi bir öğe için bu gerçekleşmezse, insan işaretleyiciler tarafından belirlenen standartla eşleşmesi gerektiğinden onu kaldırırız. .95-.99 arasında bir korelasyon bekliyoruz. Bu, testlerin %95-99 arasında, insan tarafından işaretlenmiş numunelerle tamamen aynı şekilde işaretleneceği anlamına gelir.

Bu, insan işaretli konuşma testlerinin güvenilirliğine kıyasla inanılmaz derecede yüksektir. Özünde, AI motorunu eğitmek için bir grup son derece uzman insan değerlendirici kullanıyoruz ve ardından standartları defalarca kopyalanıyor.

Yapay zeka, yazma sınavlarını puanlamak için nasıl kullanılır?

AI yazma puanlamamız, adı verilen bir teknoloji kullanır. LSA, yalnızca yüzeysel özelliklerine değil, kelimelerin arkasındaki anlama dayalı olarak yazmayı analiz edebilen ve puanlayabilen bir doğal dil işleme tekniğidir.

Konuşma tanıma akustik modellerimize benzer şekilde, önce dile özgü bir metin tanıma modeli kuruyoruz. Sisteme büyük miktarda metin besliyoruz ve LSA, kelimelerin birbirleriyle nasıl ilişkili olduğunu ve örneğin İngilizce dilinde nasıl kullanıldığını öğrenmek için yapay zeka kullanıyor.

Dil modeli oluşturulduktan sonra, motoru bir testteki her yazılı öğeyi puanlamak için eğitiriz. Konuşan maddelerde olduğu gibi, bunu da önce öğeleri puanlamak için insan uzman puanlayıcıları kullanarak, çift işaretleme kullanarak yapıyoruz. Her bir madde için yüzlerce yazılı yanıt alırlar ve bu 'Standartlar' daha sonra motoru eğitmek için kullanılır.

Daha sonra, insan tarafından işaretlenmiş çok daha fazla öğeyi besleyerek eğitilmiş motoru doğrularız ve makine puanlarının insan puanlarıyla çok yüksek oranda ilişkili olup olmadığını kontrol ederiz.

Ölçüt her zaman uzman insan puanlarıdır. Yapay zeka sistemimiz insan işaretleyiciler tarafından verilen puanlarla yakından eşleşmiyorsa, insan işaretleyiciler tarafından belirlenen standartla eşleşmesi çok önemli olduğundan öğeyi kaldırırız.

AI'nın birden fazla özelliği işaretleme yeteneği

İnsan belirteçlerinin konuşma ve yazılı öğeleri puanlamada karşılaştıkları zorluklardan biri, tek bir öğe üzerinde birçok özelliği değerlendirmektir. Örneğin, konuşmayı değerlendirirken ve puanlarken, içerik, akıcılık ve telaffuz için ayrı puanlar vermeleri gerekebilir.

Yazılı yanıtlarda, işaretleyicilerin kelime dağarcığı, stil ve dilbilgisi için bir yazı parçasını puanlaması gerekebilir. Etkili bir şekilde, her bir öğeyi en az üç kez, belki de daha fazla işaretlemeleri gerekebilir. Bununla birlikte, AI sistemlerini konuşma ve yazmadaki her özellik puanı konusunda eğittikten sonra, herhangi bir sayıda özellikteki öğeleri anında ve hatasız olarak işaretleyebilirler.

Yapay zekanın önyargı eksikliği

Herhangi bir test için temel bir öncül, herhangi bir adaya hiçbir avantaj veya dezavantaj verilmemesi gerektiğidir. Başka bir deyişle, olumlu veya olumsuz önyargı olmamalıdır. İnsan işaretli konuşma ve yazılı değerlendirmelerde bunu başarmak çok zor olabilir. Aslında, adaylar genellikle bir başkası onları duymuş veya çalışmalarını okumuş olsaydı farklı bir puan alabileceklerini düşünürler.

Yapay zeka sistemlerimiz önyargı sorununu ortadan kaldırıyor. Bu, konuşma ve yazma yapay zeka sistemlerimizin çok çeşitli insan aksanları ve yazma türleri üzerinde eğitilmesini sağlayarak yapılır.

Motorlarımızı eğitmek için mükemmel anadili aksanları veya yazı stilleri istemiyoruz. Dünyanın dört bir yanından yerel olmayan temsili örnekler kullanıyoruz. Konuşma ve yazma puanlaması için yapay zeka sistemlerimizi ilk kurduğumuzda, öğelerimizi denedik ve milyonlarca öğrenci yanıtını kullanarak motorlarımızı eğittik. Yeni öğeler geliştirildikçe bunu yapmaya devam ediyoruz.

Yapay zeka otomatik değerlendirmesinin avantajları

Ev ödevi testlerini ve sınavlarını elle işaretlemekte yanlış bir şey yoktur. Aslında, öğretmenlerin öğrencilerini tanımaları ve kişisel geri bildirim ve tavsiyelerde bulunmaları çok önemlidir. Bununla birlikte, günlük veya haftalık yüzlerce testi manuel olarak düzeltmek tekrarlayıcı, zaman alıcı, her zaman güvenilir olmayabilir ve sınıfta öğrencilerle birlikte çalışmaktan zaman alabilir. Biçimlendirici ve özetleyici değerlendirmelerde yapay zekanın kullanılması, öğrenciler için değerlendirilen uygulama süresini artırabilir ve öğretmenler için not yükünü azaltabilir.

Dil öğrenimi yüksek yeterlilik seviyelerine ilerlemek zaman alır, çok zaman alır. Yapay zekanın karma kullanımı şunları yapabilir:

  • KiÅŸiselleÅŸtirilmiÅŸ öğrenme ve tanısal deÄŸerlendirme geri bildirimi saÄŸlamak için biçimlendirici deÄŸerlendirmeninÌýartan önemini ele alın

  • Öğrencilerin tahsis edilen öğretim süresi içinde ve dışında pratik yapmalarına ve anında geri bildirim almalarına izin verin

  • Öğretmenlerin iÅŸ yükü sorununu ele alın

  • İnsanların en iyi yaptığı ve makinelerin en iyi yaptığı ÅŸeylerden yararlanarak insanlar ve makineler arasında erdemli bir kombinasyon oluÅŸturun.

  • Yüksek riskli testlerde adil, hızlı ve tarafsız özetleyici deÄŸerlendirme puanları saÄŸlayın.

Umarız bu makale, yapay zekanın dil testlerimizde konuşma ve yazmayı değerlendirmek için nasıl kullanıldığına dair birkaç önemli soruyu yanıtlamıştır. Google'ın Baş Bilim İnsanı ve Stanford Profesörü Fei-Fei Li'den ilginç bir alıntı, yapay zekayı şöyle tanımlıyor:

"Öğrencilerime sık sık 'yapay zeka' adıyla yanıltılmamalarını söylüyorum - bunda yapay bir şey yok; Yapay zeka insanlar tarafından yapılır, insanlar gibi davranması ve nihayetinde insan yaşamlarını ve insan toplumunu etkilemesi amaçlanır."

Biçimlendirici ve özetleyici değerlendirmelerde yapay zeka asla öğretmenlerin rolünün yerini almayacaktır. Yapay zeka öğretmenleri destekleyecek, öğrencilerin kendilerini geliştirmeleri için sonsuz fırsatlar sunacak ve yavaş, güvenilmez ve genellikle adil olmayan yüksek riskli değerlendirmelere bir çözüm sunacaktır.

ELT'de yapay zeka değerlendirmelerine örnekler

ɫèAV'da, yapay zeka teknolojisini kullanarak bir dizi değerlendirme geliştirdik.

Versant

Versant testleri, herhangi bir okulda, kuruluşta veya işletmede dil yeterlilik ölçütleri oluşturmaya yardımcı olacak harika bir araçtır. Öğrenci için uygun seviyeyi belirlemek için yerleştirme testleri için özel olarak tasarlanmıştır.

PTE Academic

, bir üniversiteye yerleşmek, iş bulmak veya vize almak için İngilizce düzeylerini kanıtlaması gerekenlere yöneliktir. Testleri puanlamak için yapay zekayı kullanır ve sonuçlar beş gün içinde hazır olur.

ɫèAV English International Certificate (PEIC)

ɫèAV English International Certificate (PEIC) ayrıca otomatik değerlendirme teknolojisini kullanır. Evde veya okulda (veya güvenli bir test merkezinde) isteğe bağlı olarak iki saatlik bir test ile. Gelişmiş konuşma tanıma ve sınav notlandırma teknolojisi ile dünya çapındaki profesyonel ELT sınav işaretleyicilerinin uzmanlığının bir kombinasyonunu kullanan patentli yazılımımız, İngilizce dil becerisini ölçebilir.

Öğrenme ve testlerimizde yapay zeka kullanımı hakkında daha fazla bilgiyi buradan okuyun veya öğrencileriniz için hangi İngilizce testinin doğru olduğunu merak ediyorsanız, 'Öğrencilerim için hangi sınav doğru?' yazımıza göz atmayı unutmayın.

ɫèAV'dan daha fazla blog

  • A person in a striped shirt writes with a marker on a whiteboard, holding a clip board

    Clear path to fast-track progress: Why choose assessment underpinned by the GSE

    By
    Okuma zamanı: 4 minutes

    At the beginning of every school year, we welcome new learners into our classrooms with the same core question: Where are our students now, and how far can we take them?

    For English teachers, this reveals a huge challenge. In a single class, we might have one student at an A2 level, while others are solidly B1 or just entering A2+. Navigating such a wide range of abilities can feel overwhelming.

    We’ve all seen it: students can spend months (or even years) studying English and still feel like they haven’t moved up a level. Teachers work incredibly hard, and students put in the effort, but progress feels intangible. Why is that? And more importantly, how can schools make it easier to see and support that progress?

    In recent years, I have found a powerful ally in answering that question: the Global Scale of English (GSE). Backed by ɫèAV and aligned with the CEFR, the GSE offers more than just levels, it provides a clear, data-informed path to language growth. Most importantly, it gives teachers and school leaders the ability to set meaningful goals and measure real progress.

    But, how is this useful at the beginning of the school year?

    Starting with assessment

    To get a clear picture from the start, assessment is essential; there’s no doubt about it. However, it can't just be a punctuation mark at the end of a term or a requirement from administration. Used strategically, this first assessment can be the compass that guides instruction and curriculum decisions, empowering both teachers and students from day one. This is why choosing the correct assessment tools becomes fundamental.

    The GSE difference: Precision, clarity, confidence

    Unlike the broad bands of the CEFR, the GSE provides a granular scale from 10 to 90, breaking down each skill into precise learning objectives. This allows educators to monitor progress at a much closer level, often identifying improvements that would otherwise go unnoticed.

    When learners see that their score has moved from 36 to 42, even if their overall CEFR level hasn’t changed, they gain confidence. They recognize that learning is a continuous process rather than a series of steps. Teachers, in turn, are able to validate growth, provide clear evidence of learning and tailor instruction to the learner’s current needs, not just their general level.

    For example, two students might both be classified as "A2", but the GSE gives us a much clearer picture: a student with a GSE score of 35 is likely mastering simple sentences, while another student scoring 40 might already be comfortable writing simple stories and is ready to tackle B1-level tasks.

    This isn't just data: it's a roadmap. It tells us exactly what to teach next, allowing us to differentiate with confidence instead of relying solely on gut feeling.

    GSE tools that make it happen

    ɫèAV offers a comprehensive range of GSE-aligned assessment tools that support different stages of the learning journey. Each tool plays a distinct role in placement, diagnosis, benchmarking or certification.

  • A person in a denim jacket and striped shirt holds glasses and a notebook, standing by a window with bright daylight.

    What happens in the brain when you learn a language?

    By
    Okuma zamanı: 7 minutes

    Whether you’re picking up Spanish for travel, Mandarin for business or French just for fun, you’re not only expanding your communication skills, you’re also giving your brain a powerful workout. But what actually happens inside your brain when you learn a language?Ìý

    The brain’s language centers

    Your brain is made up of many parts and two areas are significant for language:

    • : Located in the frontal lobe, this region helps you produce speech and form sentences.
    • : Found in the temporal lobe, this area helps you understand spoken and written language.

    When you start learning a new language, these areas get busy. They work together to help you listen, speak, read and write in your new language (Friederici, 2011).

  • What’s it like to teach English in Nepal?

    By
    Okuma zamanı: 3 minutes

    Anandi Vara was trained in teaching English in Kathmandu, Nepal before teaching at a monastery in Pokhara. There she taught students ranging from six to 10 years of age, both in groups and individually. Here she reveals the lessons she learned during her time thereÌý– including how to avoid being perturbed by a cockroach attack.

    Whatever you do: don’t freak out

    It just makes everything worse. It’s easy for things to get overwhelming – a sense that can be made worse by the feeling of homesickness, especially if it’s your first time living abroad – but thinking rationally, and getting to the source of what’s causing the worry, usually helps. It’s important, as you don't want to share your fear in lessons because you’re the teacher and need to show confidence.

    This was, however, tested to the limit when I had a cockroach dangled in front of my face. It took all my strength to stay calm. I gave an unimpressed look, thereby establishing myself as the figure of authority, which seemed to work.

    Be aware of cultural traditions

    It is important to remember that every country has its own traditions. I was teaching in a monastery, so I made sure to wear respectful clothing, even in the face of soaring temperatures. The more I learned about the Tibetan culture, the more fascinated I became by it. The students taught me how to write my name in Tibetan and the meaning behind it. I learned about Tibetan history and Tibetan culture.

    I also found that the more I showed willingness to learn about the Tibetan culture, the more I bonded with the students, so that when it was time to teach, the students were more cooperative in lessons, engaging and participating more.

    Teaching is two-way learning

    There is so much I learned teaching abroad, both in the classroom and out. Making mistakes as you begin is only natural, but it’s whether you can learn from these mistakes that counts. No two students are ever the same so it’s a constant process of learning as you go. As a result, I learned about the environment I was in – from traditional prayer ceremonies to the Tibetan alphabetÌý– and about myself, notably organizational skills and a renewed curiosity about the English language.

    Be Flexible

    Sometimes it doesn’t matter if you’ve planned your lesson down to the smallest detail – if it doesn’t take, then it doesn’t take. I was only 10 minutes into a lesson once and I could tell that I was beginning to lose the students’ attention. Not only did it show that they were uninterested, it also distracted me from what I was doing. It was at this point that I threw out my existing plan and tried a whole new lesson: I had the students up on their feet and engaging with each other and, although completely improvised, it was very successful.

    Patience is a must

    During my one-on-one mentoring session, my student seemed to have no motivation. He wasn’t learning as well as the other students and had therefore given up. No matter what I tried, he refused to cooperate, but I didn’t let it put me off. I kept trying different methods until finally finding one that he responded to. I made sentence structuring into a game. It wasn’t anything fancy and consisted of scraps of paper with words written on them.

    Although it took a lot of time to find the right angle, it was worth it because he soon realised that although it might take longer for him to pick things up, he would eventually get there and have a greater sense of accomplishment.