هل يمكن لأجهزة الكمبيوتر حقا تصحيح الامتحانات؟ فوائد التقييمات الآلية لتدريس اللغة الإنجليزية

ɫèAV Languages
الأيدي التي تكتب على جهاز كمبيوتر محمول مع الرموز

يعد التقييم الآلي ، بما في ذلك استخدام الذكاء الاصطناعي (الذكاء الاصطناعي) ، أحد أحدث حلول تكنولوجيا التعليم. إنه يسرع أوقات تصحيح الامتحان ، ويزيل التحيزات البشرية ، وهو دقيق وموثوق به على الأقل مثل الفاحصين البشريين. مع استمرار الابتكارات ، يعد هذا الابتكار مغيرا حقيقيا لقواعد اللعبة للمعلمين والطلاب.

ومع ذلك ، فقد قوبل بشكل مفهوم بالعديد من الأسئلة وأحيانا الشكوك في مجتمع ELT - هل يمكن لأجهزة الكمبيوتر حقا تصحيح اختبارات التحدث والكتابة بدقة؟

الجواب هو نعم مدوية. يخضع الطلاب من جميع أنحاء العالم بالفعل لاختبارات الذكاء الاصطناعي درجة. توفر اختبارات و Versant- على سبيل المثال - درجات آلية غير متحيزة وعادلة وسريعة لامتحانات التحدث والكتابة - بغض النظر عن المكان الذي يعيش فيه المتقدمون للاختبار ، أو لهجتهم أو جنسم.

تشرح هذه المقالة العمليات الرئيسية التي ينطوي عليها الذكاء الاصطناعي التسجيل الآلي وتوضح أن التقنيات الذكاء الاصطناعي مبنية على أسس الأحكام البشرية المتسقة للخبراء. لذلك ، دعونا نوضح الالتباس حول التسجيل الآلي الذكاء الاصطناعي وننظر في كيفية مساعدة المعلمين والطلاب على حد سواء.

الذكاء الاصطناعي مقابل التسجيل الآلي التقليدي

بادئ ذي بدء ، دعنا نميز بين التسجيل الآلي التقليدي و الذكاء الاصطناعي. عندما نتحدث عن التسجيل الآلي ، فإننا نعني بشكل عام تسجيل العناصر التي تكون إما عناصر متعددة الخيارات أو عناصر مغلقة. قد تضطر إلى إعادة ترتيب الجمل ، والاختيار من قائمة منسدلة ، وإدراج كلمة مفقودة - هذا النوع من الأشياء. تم تصميم أنواع الأسئلة هذه لاختبار مهارات معينة ويضمن التسجيل الآلي إمكانية تمييزها بسرعة ودقة في كل مرة.

بينما يمكن استخدام عناصر يتم تسجيلها تلقائيا مثل هذه لتقييم المهارات الاستقبالية مثل الاستماع وفهم القراءة ، إلا أنها لا تستطيع تحديد المهارات الإنتاجية للكتابة والتحدث. ستكون استجابة كل طالب في الكتابة والتحدث مختلفة ، فكيف يمكن لأجهزة الكمبيوتر تمييزها؟

هذا هو المكان الذي يأتي فيه الذكاء الاصطناعي.

نسمع الكثير عن كيفية استخدام الذكاء الاصطناعي بشكل متزايد في المجالات التي تحتاج إلى التعامل مع كميات كبيرة من البيانات غير المهيكلة ، بشكل فعال ودقيق بنسبة 100٪ - كما هو الحال في التشخيص الطبي ، على سبيل المثال. في اختبار اللغة ، يستخدم الذكاء الاصطناعي برامج كمبيوتر متخصصة لتصنيف الاختبارات الكتابية والشفوية.

كيف يتم استخدام الذكاء الاصطناعي لتسجيل امتحانات المحادثة

الخطوة الأولى هي بناء نموذج صوتي لكل لغة يمكنه التعرف على الكلام وتحويله إلى أشكال موجية ونص. في حين أن هذه التكنولوجيا كانت غير عادية للغاية ، يمكن لمعظم هواتفنا الذكية القيام بذلك الآن.

ثم يتم تدريب هذه النماذج الصوتية لتسجيل كل موجه أو عنصر في الاختبار. نقوم بذلك باستخدام مقيمين خبراء بشريين لتسجيل العناصر أولا ، باستخدام العلامات المزدوجة. يسجلون مئات الردود الشفوية لكل عنصر ، ثم يتم استخدام هذه "المعايير" لتدريب المحرك.

بعد ذلك ، نقوم بالتحقق من صحة المحرك المدرب عن طريق تغذية العديد من العناصر التي تحمل علامة بشرية ، والتحقق من أن درجات الماكينة مرتبطة ارتباطا وثيقا بالدرجات البشرية. إذا لم يحدث هذا لأي عنصر ، فإننا نزيله ، حيث يجب أن يتطابق مع المعيار الذي حددته العلامات البشرية. نتوقع وجود علاقة بين .95-.99. وهذا يعني أنه سيتم وضع علامة على الاختبارات بين 95-99٪ تماما مثل العينات التي تحمل علامة بشرية.

هذا مرتفع بشكل لا يصدق مقارنة بموثوقية اختبارات التحدث التي تحمل علامة الإنسان. في جوهرها ، نستخدم مجموعة من المقيمين البشريين ذوي الخبرة العالية لتدريب محرك الذكاء الاصطناعي ، ثم يتم تكرار معيارهم مرة تلو الأخرى.

كيف يتم استخدام الذكاء الاصطناعي لتسجيل امتحانات الكتابة

يستخدم تسجيل الذكاء الاصطناعي في الكتابة لدينا تقنية تسمى . LSA هي تقنية معالجة لغة طبيعية يمكنها تحليل الكتابة وتسجيلها ، بناء على المعنى الكامن وراء الكلمات - وليس فقط خصائصها السطحية.

على غرار نماذجنا الصوتية للتعرف على الكلام ، نقوم أولا بإنشاء نموذج التعرف على النص الخاص باللغة. نقوم بتغذية كمية كبيرة من النص في النظام ، ويستخدم LSA الذكاء الاصطناعي لمعرفة أنماط كيفية ارتباط الكلمات ببعضها البعض واستخدامها ، على سبيل المثال ، في اللغة الإنجليزية .

بمجرد إنشاء نموذج اللغة ، نقوم بتدريب المحرك على تسجيل كل عنصر مكتوب في الاختبار. كما هو الحال في العناصر الناطقة ، نقوم بذلك باستخدام مقيمين خبراء بشريين لتسجيل العناصر أولا ، باستخدام العلامات المزدوجة.

يسجلون عدة مئات من الردود المكتوبة لكل عنصر ، ثم يتم استخدام هذه "المعايير" لتدريب المحرك.

ثم نقوم بالتحقق من صحة المحرك المدرب عن طريق تغذية العديد من العناصر التي تحمل علامة بشرية ، والتحقق من أن درجات الماكينة مرتبطة ارتباطا وثيقا بالدرجات البشرية.

المعيار هو دائما درجات الخبراء البشرية. إذا كان نظام الذكاء الاصطناعي الخاص بنا لا يتطابق بشكل وثيق مع الدرجات التي تقدمها العلامات البشرية ، فإننا نزيل العنصر ، لأنه من الضروري مطابقة المعيار الذي حددته العلامات البشرية.

قدرة الذكاء الاصطناعي على تمييز سمات متعددة

أحد التحديات التي يواجهها الأشخاص في تسجيل العناصر الناطقة والمكتوبة هو تقييم العديد من السمات في عنصر واحد. على سبيل المثال ، عند تقييم وتسجيل التحدث ، قد يحتاجون إلى إعطاء درجات منفصلة للمحتوى والطلاقة والنطق.

في الردود المكتوبة ، قد تحتاج العلامات إلى تسجيل جزء من الكتابة للمفردات والأسلوب والقواعد. على نحو فعال ، قد يحتاجون إلى وضع علامة على كل عنصر على الأقل ثلاث مرات ، وربما أكثر. ومع ذلك ، بمجرد تدريب أنظمة الذكاء الاصطناعي على كل درجة سمة في التحدث والكتابة ، يمكنهم بعد ذلك تمييز العناصر على أي عدد من السمات على الفور - وبدون أخطاء.

افتقار الذكاء الاصطناعي إلى التحيز

الفرضية الأساسية لأي اختبار هي أنه لا ينبغي إعطاء أي ميزة أو عيب لأي مرشح. بمعنى آخر ، يجب ألا يكون هناك تحيز إيجابي أو سلبي. قد يكون من الصعب جدا تحقيق ذلك في تقييمات التحدث والكتابة التي تحمل علامة الإنسان. في الواقع ، غالبا ما يشعر المرشحون أنهم ربما حصلوا على درجة مختلفة إذا سمعهم شخص آخر أو قرأ عملهم.

أنظمتنا الذكاء الاصطناعي تقضي على قضية التحيز. يتم ذلك من خلال ضمان تدريب أنظمة الذكاء الاصطناعي التحدث والكتابة لدينا على مجموعة واسعة من اللهجات البشرية وأنواع الكتابة.

لا نريد لهجات مثالية تتحدث اللغة الأم أو أساليب كتابة لتدريب محركاتنا. نحن نستخدم عينات تمثيلية غير أصلية من جميع أنحاء العالم. عندما أنشأنا في البداية أنظمة الذكاء الاصطناعي الخاصة بنا لتسجيل درجات التحدث والكتابة ، جربنا عناصرنا ودربنا محركاتنا باستخدام ملايين ردود الطلاب. نواصل القيام بذلك الآن مع تطوير عناصر جديدة.

فوائد التقييم الآلي الذكاء الاصطناعي

لا حرج في وضع علامات يدوية على اختبارات وامتحانات الواجبات المنزلية. في الواقع ، من الضروري للمعلمين التعرف على طلابهم وتقديم ملاحظات ونصائح شخصية. ومع ذلك ، يمكن أن يكون تصحيح مئات الاختبارات يدويا ، يوميا أو أسبوعيا ، متكررا ويستغرق وقتا طويلا ولا يمكن الاعتماد عليه دائما ويستغرق وقتا بعيدا عن العمل جنبا إلى جنب مع الطلاب في الفصل الدراسي. يمكن أن يؤدي استخدام الذكاء الاصطناعي في التقييمات التكوينية والختامية إلى زيادة وقت الممارسة المقدر للطلاب وتقليل عبء التصحيح على المعلمين.

يستغرق تعلم اللغة وقتا طويلا ، الكثير من الوقت للتقدم إلى مستويات عالية من الكفاءة. يمكن أن يؤدي الاستخدام المخلوط الذكاء الاصطناعي إلى:

  • معالجة الأهمية المتزايدة للتقييمالتكويني لدفع التعلم الشخصي وملاحظات التقييم التشخيصي

  • السماح للطلاب بالممارسة والحصول على ملاحظات فورية داخل وخارج وقت التدريس المخصص

  • معالجة مسألة عبء عمل المعلم

  • قم بإنشاء مزيج فاضل بين البشر والآلات ، والاستفادة مما يفعله البشر بشكل أفضل وما تفعله الآلات بشكل أفضل.

  • تقديم درجات تقييم تلخيصية عادلة وسريعة وغير متحيزة في الاختبارات عالية المخاطر.

نأمل أن تكون هذه المقالة قد أجابت على بعض الأسئلة الملحة حول كيفية استخدام الذكاء الاصطناعي لتقييم التحدث والكتابة في اختبارات اللغة لدينا. يصف اقتباس مثير للاهتمام من Fei-Fei Li ، كبير العلماء في Google وأستاذ ستانفورد الذكاء الاصطناعي مثل هذا:

"غالبا ما أخبر طلابي ألا يضللهم اسم" الذكاء الاصطناعي "- لا يوجد شيء مصطنع في ذلك. الذكاء الاصطناعي من صنع البشر ، ويهدف إلى التصرف [مثل] البشر ، وفي النهاية ، التأثير على حياة البشر والمجتمع البشري ".

الذكاء الاصطناعي في التقييمات التكوينية والختامية لن تحل أبدا محل دور المعلمين. ستدعم الذكاء الاصطناعي المعلمين ، وتوفر فرصا لا حصر لها للطلاب للتحسين ، وتوفر حلا للتقييمات البطيئة وغير الموثوقة وغير العادلة في كثير من الأحيان.

أمثلة على تقييمات الذكاء الاصطناعي في تدريس اللغة الإنجليزية

في بيرسون، قمنا بتطوير مجموعة من التقييمات باستخدام تقنية الذكاء الاصطناعي.

Versant

تعد اختبارات Versant أداة رائعة للمساعدة في وضع معايير الكفاءة اللغوية في أي مدرسة أو منظمة أو شركة. وهي مصممة خصيصا لاختبارات تحديد المستوى لتحديد المستوى المناسب للمتعلم.

PTE Academic

يستدف أولئك الذين يحتاجون إلى إثبات مستوى الإنجليزية للحصول على مكان جامعي أو وظيفة أو تأشيرة. يستخدم الذكاء الاصطناعي لتسجيل الاختبارات والنتائج متاحة في غضون خمسة أيام.

معيار الإنجليزية

يتم تسجيلالإنجليزية Benchmark أيضا باستخدام نفس تقنية التقييم الآلي. يستدف هذا الاختبار ، الذي يتم إجراؤه على جهاز لوحي ، المتعلمين الصغار ويأخذ شكل اختبار ممتع يشبه اللعبة. يغطي مهارات التحدث والاستماع والقراءة والكتابة ، ويقيس قدرة الطالب ويقترح أنشطة المتابعة وخطوات التدريس التالية.

المزيد من المدونات من بيرسون

  • Grammar 101: insider tips and tricks to instantly improve your writing (part 4)

    By
    وقت القراءة: 7 minutes

    Punctuation makes your writing easier to read and understand, but it can be tricky to master. As an editor and proofreader, I often notice people confusing semi-colons and colons, so we'll explore the difference between them. And because both are often used in lists, we'll also look at the humble comma – and its sometimes-controversional cousin, the Oxford comma.

    Semi-colons and colons both connect phrases in a sentence but are used in different situations.

    Understanding colons

    Colons introduce important information and explanations. They're often used before lists as a replacement for phrases like "they are" and "which is":

    • He offered me a choice of drinks: tea, coffee or hot chocolate.
    • I packed the essentials in my bag: water, pens and a magazine.
    • She speaks three languages: English, French and Portuguese.

    You can also think of a colon as a spotlight, with the phrase that comes after the colon explaining or expanding what came before it.

    • In 1903, travel was changed forever by an important event: Orville and Wilbur Wright's first successful flight.
    • He loves visiting the animals at the farm: cows are his favourite.
    • There is one rule I live by: I treat others as I wish to be treated.

    The secrets of semi-colons

    A semi-colon links two ideas that are closely related and that would be two complete sentences if you used a period instead. They give a softer transition than a period would, and they're often used instead of conjunctions like "and", "but" and "because":

    • I love eating pizza; my sister loves eating burgers.
    • I wanted to go for a swim; I couldn't find my goggles.
    • I'm going to the park; the weather is beautiful.

    Semi-colons also seperate items in long lists to make life easier for the reader and stop a sentence becoming a sea of apostrophes. For example:

    • I've got my shopping list ready: peppers, carrots and oranges from the market; toothpaste, shampoo and pain relief from the drugstore; and a newspaper, snack and drink from the newsstand.

    Standard comma or Oxford comma?

    An Oxford comma goes before "and" or "or" at the end of a list. The first example has an Oxford comma, the second doesn't.

    • Please bring me a sandwich made with cheese, lettuce, and tomato.
    • Please bring me a sandwich made with cheese, lettuce and tomato.

    American English generally favors the Oxford comma, British English typically omits it, unless needed for clarity. Compare:

    • I love my parents, Taylor Swift and Keanu Reeves.
    • I love my parents, Taylor Swift, and Keanu Reeves.

    As with many areas of punctuation, whether you choose to use the Oxford comma is a matter of personal preference. However, the most important thing is to be consistent in your usage.

  • Precision teaching with AI: Aligning GSE objectives with generative AI for targeted materials

    By
    وقت القراءة: 4 minutes

    English teachers today face increasing demands: create engaging content, differentiate instruction and address diverse learner needs – all within a limited time. The rise of Generative AI, like ChatGPT, offers a promising solution. But without proper guidance, AI-generated content can lack educational value. This blog post introduces a practical, research-informed approach to using AI tools aligned with the Global Scale of English (GSE). You will learn how this framework helps educators design accurate, personalized and level-appropriate English teaching materials quickly and confidently.

    Why GSE and AI are a game-changing combination for ELT

    The Global Scale of English (GSE) is a CEFR-aligned framework developed by ɫèAV, offering detailed "can-do" learning objectives. It includes nearly 4,000 descriptors across speaking, listening, reading and writing skills, offering more precision than traditional level labels like A2 or B1. At the same time, Generative AI tools such as ChatGPT can generate entire lessons, tasks and assessments in seconds. The challenge lies in ensuring this content is aligned with clear pedagogical outcomes.

    Pairing AI’s creative speed with the GSE’s structured outcomes offers a scalable way to meet learner needs without compromising instructional quality.

    Unlocking measurable, differentiated and efficient teaching with GSE and AI

    The GSE makes objectives measurable

    Unlike generic teaching goals, GSE objectives are specific and measurable. For example, a B1-level learner objective might state:

    “Can identify a simple chronological sequence in a recorded narrative or dialogue.” (GSE 43)
    This clarity helps teachers define outcomes and ensure each AI-generated task targets an actual language skill, not just generic content.

    Generative AI enhances productivity

    Teachers using Generative AI can create draft lesson materials in minutes. By inputing a structured prompt such as:

    “Create a B1 reading activity that helps learners summarize the main points of a short article.”
    ChatGPT can instantly generate content that meets the learning goal. When guided by the GSE, AI becomes a collaborative assistant as well as a time-saver.

    The GSE + AI combination supports differentiation

    Because the GSE includes descriptors across a wide proficiency range (from pre-A1 to C2), teachers can tailor AI-generated content to meet the exact needs of their students. Mixed-level classrooms or tutoring contexts benefit especially from this, as teachers can create multiple versions of a task with consistent scaffolding.

    Practical tips

    • Use the GSE Teacher Toolkit to select objectives based on skill, level or function.
    • When prompting ChatGPT, include the GSE descriptor in your input for more precise results.
    • Always review and adapt the AI output to match your learners’ context, culture and curriculum.
    • Create a prompt library mapped to GSE codes to save time in future planning.

    A step-by-step example of the GSE and AI in action

    Here is a typical application of the workflow:

    1. A teacher selects a GSE objective, such as:
      “Can write a basic formal email/letter requesting information.” (GSE 46).
    2. Within seconds, a sample formal email, accompanied by a short reading comprehension task and a vocabulary activity, is generated.
    3. The reading task serves as a model to help learners analyze the structure, tone, and key language features of a well-written email before attempting their own.
    4. The teacher then reviews and refines the output for clarity, appropriateness, and context relevance.

    This process supports targeted teaching while significantly reducing preparation time.

    Overcoming challenges: Ensuring quality and relevance

    Challenge: AI outputs may lack cultural context, level appropriateness or instructional clarity.
    Solution: Always pair AI with professional judgment. Use the GSE to check that skills match the intended outcome, and adjust the complexity of the language as needed.

    Challenge: Teachers may be unfamiliar with how to write effective AI prompts.
    Solution: Start simple with templates like:

    “Create a [skill] activity at [level] that supports this GSE objective: [insert objective].”

    Challenge: Risk of over-relying on AI for instruction.
    Solution: Use AI as a starting point, not the final product. Combine AI-generated content with classroom interaction, feedback and your own creativity.

    Teaching tools that make this easier

    • : for exploring and selecting level-appropriate learning objectives
    • : for generating customizable teaching content
    • GSE Smart Lesson Generator: an AI-powered lesson creation tool developed by ɫèAV that uses the GSE framework to automatically generate high-quality activities and lesson plans
    • Google Docs or Word: for editing and organizing your materials before class

    Confidently transforming English teaching

    Combining Generative AI with the Global Scale of English allows teachers to design materials that are both fast and focused. The GSE provides the structure; AI provides the speed. Together, they offer a sustainable solution for personalized English instruction that respects both learner needs and instructional quality.

  • woman writing in notepad while looking at laptop computer and smiling

    Grammar 101: insider tips and tricks to instantly improve your writing (part 3)

    By
    وقت القراءة: 7 minutes

    Many people can't tell the difference between the hyphen (-), the en-dash (–), and the em-dash (—). They may look similar but they can all help ensure that your writing looks professional and is easy to read. As an overview:

    • Hyphens improve clarity: there is a big difference between "a man-eating shark" and "a man eating shark".
    • En-dashes and em-dashes share a lot of the same functionality – including allowing for explanations and examples to be shared, and separating clauses – however, they are not interchangeable and their use is often down to personal preference.

    Let's explore what these three different dashes do and how they could improve your writing.