日语吧 关注:1,035,874贴子:19,277,611

手把手教你日语能力考中的赋分制!我不允许还有人搞不懂!

只看楼主收藏回复

什么是尺度得点?什么是项目反应理论?一篇文章让你明白!(难,但是手把手,所以,长文预警)
tips:学以致用,相关知识点所推出来的直观理解和实用的结论我会在附近单独强调,当然我也会在最后进行总结,一定要看到最后喔!


IP属地:山西1楼2024-07-10 20:51回复
    2楼自古归楼主


    IP属地:山西2楼2024-07-10 20:52
    收起回复
      2025-08-25 17:38:19
      广告
      不感兴趣
      开通SVIP免广告
      开始咱们的教学之前,让我费一点点篇幅,先用一个问题来引出我们的主题。
      咱们常见的打分方式,考生分数是回答正确的所有题目分数的总和,虽然我们经常被这套算法评价自身能力好坏,有时欢喜有时愁,但是跳出来想一想,利用这种方式来评价考生能力,是否绝对合理呢,就没有什么不足之处吗?


      IP属地:山西3楼2024-07-10 20:53
      回复
        举个很简单的例子,100分的数学卷子,小明得了75分。好了,也许你会下意识的认为,小明这水平还算过得去嘛。小红和小明不在一个学校,某次数学考试,小红只得了60分,好了,明显小明比小红强嘛。也许有人已经反应过来了,如果小明做的是非常简单的中专期中卷子,而小红却在卷奥赛,他们分数的大小很明显并不能成为能力的评价标准。


        IP属地:山西4楼2024-07-10 20:54
        收起回复
          官方关于『尺度得点』的文件明确说明了这一点,传统的评分方式,即所谓“素点”,分数所体现的能力,和试题的难易程度息息相关。但是很明显,对于JLPT这种针对全球、而且年年举办的大型考试来说,这是难以容忍的。

          如果今年题不小心出难了,岂不是说今年的考生水平集体暴跌?所以我们需要一种,尽量让得分与试题难度无关的打分方式,来让分数==能力。上世纪90年代蓬勃发展的『項目反応理論』正好为此提供了一种较好的解决办法。


          IP属地:山西5楼2024-07-10 20:55
          回复
            题外的题外话:
            其实,普通的评分方式,虽然说分数所表示的能力取决于试题的难度,但是难度本身又取决于考生的能力。一群教育考试院的老头来考试,那自然试题可以说是非常简单,而一群根本没学过相关知识的人来,那肯定是难于登天。一个分数所表示的能力高低,得看试题难度,而试题难度又要看考生能力,这很明显是一种循环论证。
            还有就是,素点打分不能判断考生的作答“模式”,10道题,7道简单题3道难题,小明对了6道简单题,小红对了5道简单题1道难题。这俩水平是否真能划等号?
            素点也很难应对盲猜选手,小刚和小红们也考了同一场,自己做对了4道简单题,运气好碰对了2道难题,小刚和小红又谁孰优孰劣呢。
            因此,传统的评分方式有着这样那样的问题(但是很好算),因此,尺度得点被采用就显得非常合理啦。
            但是你要说尺度得点有啥缺点吗,嗯,非常难算,而且,不好估分~~~


            IP属地:山西6楼2024-07-10 20:58
            回复
              第零章 ~你以为的分数并不是分数~


              IP属地:山西7楼2024-07-10 21:00
              回复
                素点的评分方式,你的得分,体现的是你对某一份试卷的完成程度。这是我们看到分数时的第一直觉,100分,说明你全部掌握了,50分,那你就是真·一知半解。但是假如使用的是尺度得点的分数,它蕴含的还是这个意义上的分数吗?
                来,还是看看官方是咋说的


                这是公布的2023年12月N1考试的数据。180分选手,打败了所有考生的100%。对于日本国外考生,100分的人打败了61.8%的人,而日本国内相对严格,要及格需要打败71.8%的人(惨)。
                总之,分数并不意味着一份试卷的完成程度,而是表明你打败了多少同类型的选手。即使你一半没做出来,假如你处于所有人的上位,那你的分数也会高于90分。有一点与难度切割的意思了,不是吗?
                **结论1:尺度得点计算的分数,指的并不是试卷的完成程度,而是看你打败了多少人。虽然这个关系不是线性的,但的确是一一对应的。**


                IP属地:山西8楼2024-07-10 21:03
                回复
                  2025-08-25 17:32:19
                  广告
                  不感兴趣
                  开通SVIP免广告
                  快来人


                  IP属地:山西来自Android客户端9楼2024-07-10 21:08
                  收起回复
                    题外:我把这次考试的分位表也发出来吧,感兴趣可以看看。(避免这图太长70分以下我就剪切了吧)



                    IP属地:山西10楼2024-07-10 21:11
                    收起回复
                      也许你已经认可了,此分数不等于彼分数的概念了。
                      接下来,我还得来个更炸裂的:分数对于单独的一道题来说,也失去了意义!
                      **每道题,在阅卷者看来,并没有“分数”这个属性!!!**


                      IP属地:山西11楼2024-07-10 21:15
                      回复
                        我知道你很急,但是你先别急。咱们慢慢来讲。学习新知识,乐趣不就在这里吗?(我想起来今年N1这篇关于数学学习的长篇我错了3个)直觉崩坏的时候就是你学习的开始。
                        首先,尺度得点的计算并不是靠一题一题加起来的,每题对应一个分值,只有在素点时有意义,既然采用了另一种算法,分值的消失其实是合理的。
                        其次,尺度得点是模式敏感的,对的题数量一样,但是该对的对了,不应该错的错了,赋分就不会高,如果每题都用分值表示,这一点就很难做到。
                        目前有很多估分使用的是不固定分值的计算方法,有的题3分,有的题8分,这其实有一定的合理性,因为体现了有的题目比较重要,而有的题目并不重要这一事实。但是还是不能体现尺度得点的全貌,因为对于不同水平的选手,哪道题重要,哪道题不重要其实也是有区别的。


                        IP属地:山西12楼2024-07-10 21:18
                        回复
                          那么,题目不用分值来表示,又应该用什么来表示呢?
                          这就是我们下一章要说明的内容,一道题,它在“阅卷人”眼里是什么样的?


                          IP属地:山西13楼2024-07-10 21:23
                          回复
                            第一章 ~当题目没有了“分数”~


                            IP属地:山西14楼2024-07-10 21:23
                            回复
                              2025-08-25 17:26:19
                              广告
                              不感兴趣
                              开通SVIP免广告
                              n3有赋分吗


                              IP属地:浙江来自Android客户端15楼2024-07-10 21:25
                              收起回复