Category Archives: Pengukuran Psikologi & pendidikan

Perkembangan Konstruk Self-Esteem

Pendekatan Awal: Model Unidimensional

Pada awalnya, self-esteem dianggap sebagai konsep unidimensional, di mana seseorang dikategorikan memiliki self-esteem tinggi atau rendah. Rosenberg Self-Esteem Scale (RSES) (Rosenberg, 1965) adalah salah satu alat ukur paling terkenal yang menggunakan pendekatan ini. Skala ini terdiri dari pernyataan positif dan negatif yang menggambarkan bagaimana seseorang menilai dirinya sendiri secara keseluruhan. Namun, penelitian lanjutan menemukan bahwa item positif dan negatif dalam RSES sering kali membentuk dua faktor yang berbeda. Hal ini menantang asumsi bahwa self-esteem adalah konstruk tunggal yang dapat diukur secara linear (Marsh, 1996).

Perkembangan Menuju Model Dual-Factor

Pada tahun 1990-an, muncul teori bahwa self-esteem memiliki dua dimensi utama yang dapat beroperasi secara independen:

  • Self-Esteem Positif → mencerminkan penghargaan terhadap diri sendiri, kebanggaan, dan keyakinan diri.
  • Self-Esteem Negatif → berkaitan dengan perasaan tidak berharga, rendah diri, dan ketidakpuasan diri.

Tennen & Affleck (1993) serta Owens (1993) menunjukkan bahwa seseorang dapat memiliki self-esteem positif dan negatif secara bersamaan. Misalnya, seseorang bisa merasa percaya diri dalam pencapaian akademik tetapi tetap memiliki keraguan mendalam tentang nilai dirinya dalam hubungan sosial. Dalam analisis faktor konfirmatori (CFA), model bifaktorial sering ditemukan lebih sesuai dibandingkan model unidimensional (Marsh et al., 2010).

Dimensi Self-Esteem: Global vs. Spesifik

Pada tahun 1986, Marsh & Shavelson memperkenalkan gagasan bahwa self-esteem dapat dikategorikan menjadi global dan spesifik:

  • Self-esteem global mencerminkan evaluasi menyeluruh seseorang terhadap dirinya sendiri, tanpa memperhitungkan aspek-aspek spesifik dalam hidupnya. Orang dengan self-esteem global tinggi cenderung merasa bahwa dirinya berharga dalam berbagai situasi dan aspek kehidupan.
  • Self-esteem spesifik mengacu pada evaluasi seseorang terhadap dirinya sendiri dalam domain tertentu, seperti akademik, sosial, fisik, atau pekerjaan. Misalnya, seseorang dapat memiliki self-esteem tinggi dalam bidang akademik tetapi rendah dalam interaksi sosial.

Pendekatan multidimensional ini memungkinkan pemahaman yang lebih kaya tentang bagaimana self-esteem beroperasi dalam berbagai aspek kehidupan seseorang. Sebuah skala yang hanya mengukur self-esteem global mungkin tidak cukup untuk menangkap perbedaan ini. Oleh karena itu, alat ukur modern sering kali menyertakan subskala untuk mengevaluasi domain spesifik self-esteem agar hasil pengukuran lebih akurat dan kontekstual (Marsh, 1993; Harter, 1999).

Self-Esteem Eksplisit vs. Implisit

Sejak awal 2000-an, pendekatan pengukuran self-esteem mengalami perkembangan dengan membedakan antara:

  • Self-esteem eksplisit, yang diukur melalui skala kuesioner seperti RSES dan bergantung pada laporan sadar individu tentang dirinya sendiri.
  • Self-esteem implisit, yang diukur melalui metode tidak langsung seperti Implicit Association Test (IAT) yang dikembangkan oleh Greenwald & Farnham (2000), yang mengungkap evaluasi bawah sadar seseorang terhadap dirinya sendiri.

Kadang-kadang terjadi ketidaksesuaian antara self-esteem eksplisit dan implisit. Seseorang dapat secara sadar melaporkan self-esteem yang tinggi tetapi menunjukkan self-esteem negatif dalam pengukuran implisit. Fenomena ini menunjukkan bahwa validitas pengukuran self-esteem bergantung pada metode yang digunakan (Bosson et al., 2000).

Pengaruh Budaya dalam Pengukuran Self-Esteem

Self-esteem tidak hanya bergantung pada struktur psikologis individu tetapi juga dipengaruhi oleh budaya. Markus & Kitayama (1991) menyoroti bahwa dalam budaya individualistik (misalnya, di negara-negara Barat), self-esteem sering dikaitkan dengan pencapaian pribadi dan otonomi. Sebaliknya, dalam budaya kolektivistik (seperti di Asia Timur), self-esteem lebih terkait dengan keharmonisan sosial dan penerimaan oleh kelompok.

Heine et al. (1999) menemukan bahwa orang Jepang cenderung memiliki skor self-esteem eksplisit yang lebih rendah dibandingkan orang Amerika, tetapi bukan berarti mereka memiliki self-esteem rendah. Sebaliknya, self-esteem dalam budaya kolektivistik lebih bersifat relasional dan bergantung pada hubungan sosial. Hal ini menunjukkan bahwa alat ukur yang dikembangkan dalam konteks budaya tertentu tidak selalu dapat diterapkan secara langsung di budaya lain, sehingga memerlukan adaptasi dan validasi lintas budaya (Schmitt & Allik, 2005).

Kesimpulan

Pengukuran self-esteem lebih kompleks daripada sekadar menentukan apakah seseorang memiliki self-esteem tinggi atau rendah. Perkembangannya dari model unidimensional ke model bifaktorial, pembagian self-esteem global vs. spesifik, serta eksplisit vs. implisit menunjukkan bahwa alat ukur harus dirancang dengan hati-hati untuk memastikan validitas konstruknya. Selain itu, faktor budaya juga perlu diperhitungkan agar alat ukur dapat digunakan secara akurat dalam berbagai konteks.

Referensi

  • Bosson, J. K., Swann, W. B., & Pennebaker, J. W. (2000). Stalking the perfect measure of implicit self-esteem: The blind men and the elephant revisited?. Journal of Personality and Social Psychology, 79(4), 631-643.
  • Greenwald, A. G., & Farnham, S. D. (2000). Using the Implicit Association Test to measure self-esteem and self-concept. Journal of Personality and Social Psychology, 79(6), 1022-1038.
  • Heine, S. J., Lehman, D. R., Markus, H. R., & Kitayama, S. (1999). Is there a universal need for positive self-regard?. Psychological Review, 106(4), 766-794.
  • Harter, S. (1999). The construction of the self: A developmental perspective. Guilford Press.
  • Markus, H. R., & Kitayama, S. (1991). Culture and the self: Implications for cognition, emotion, and motivation. Psychological Review, 98(2), 224-253.
  • Marsh, H. W. (1993). The multidimensional structure of academic self-concept: Invariance over gender and age. American Educational Research Journal, 30(4), 841-860.
  • Marsh, H. W., & Shavelson, R. (1986). Self-concept: Its multifaceted, hierarchical structure. Educational Psychologist, 20(3), 107-123.
  • Marsh, H. W., Ellis, L. A., & Parada, R. H. (2010). Unidimensional or multidimensional self-concepts? Journal of Personality and Social Psychology, 98(4), 673-686.
  • Rosenberg, M. (1965). Society and the adolescent self-image. Princeton University Press.
  • Schmitt, D. P., & Allik, J. (2005). Simultaneous administration of the Rosenberg Self-Esteem Scale in 53 nations: Exploring the universal and culture-specific features of global self-esteem. Journal of Personality and Social Psychology, 89(4), 623-642.

Diskusi: Bagaimana implikasi dari kompleksitas ini terhadap pengembangan skala self-esteem di masa depan? Model mana yang menurut Anda lebih sesuai untuk mengukur self-esteem secara akurat dalam berbagai budaya?

Catatan: Artikel ini ditulis dengan AI sebagai materi diskusi/ studi kasus di kelas Psikometrika

Scholastic Aptitude Test, Tes Potensi Akademik

Scholastic Aptitude Test (SAT): Deskripsi

SAT adalah tes standar yang dirancang untuk mengukur keterampilan penting yang diperlukan untuk sukses secara akademik di tingkat perguruan tinggi. Tes ini diikuti oleh siswa sekolah menengah pertama dan atas sebagai persiapan masuk ke perguruan tinggi dan universitas.

SAT dibuat agar lebih selaras dengan pekerjaan yang dilakukan siswa di sekolah menengah dan untuk menciptakan tes yang relevan di dunia modern, di mana keterampilan pemecahan masalah, komunikasi yang jelas, dan pemahaman hubungan kompleks menjadi faktor kunci dalam keberhasilan karier dan kehidupan.

Tes ini bertujuan untuk menilai potensi siswa dalam menyelesaikan pekerjaan di tingkat perguruan tinggi dengan mengevaluasi keterampilan verbal dan matematika mereka.

Latar Belakang Sejarah

Tes College Board pertama kali diselenggarakan pada tahun 1901 di 67 lokasi di Amerika Serikat dan dua lokasi di Eropa. Tes ini berfokus pada mata pelajaran seperti Bahasa Inggris, Prancis, Jerman, Latin, Yunani, sejarah, matematika, kimia, dan fisika. Berbeda dengan SAT saat ini, tes tersebut tidak berbentuk pilihan ganda dan hasilnya dievaluasi dengan kategori seperti “sangat baik”, “baik”, “meragukan”, “kurang”, atau “sangat kurang”.

Keinginan yang semakin besar dari para pendidik Amerika untuk membuka akses perguruan tinggi bagi siswa terbaik di seluruh negeri mendorong pelaksanaan SAT pertama kali pada tahun 1926. “Scholastic Aptitude Test” dirancang sebagai alternatif dari ujian “College Boards” sebelumnya. Jika ujian lama berbasis kurikulum dan menguji penguasaan materi akademik, SAT menawarkan sesuatu yang baru: tes berbentuk pilihan ganda yang lebih mudah dinilai dan mengukur kemampuan umum siswa dalam belajar.

SAT berkembang dari pengalaman pengujian IQ selama Perang Dunia Pertama, ketika dua juta pria diuji dan diberi skor IQ berdasarkan hasilnya. Pembuat tes saat itu beranggapan bahwa kecerdasan adalah atribut tunggal yang diwariskan, tidak berubah sepanjang hidup, dapat diukur dengan satu angka, dan dapat digunakan untuk menentukan posisi seseorang dalam masyarakat. Meskipun SAT kemudian dikembangkan dengan pendekatan psikometrik yang lebih canggih, tes ini tetap berasal dari asumsi yang meragukan tentang bakat dan potensi manusia.

Namun, terutama setelah Perang Dunia II, SAT semakin diterima dalam sistem penerimaan perguruan tinggi di Amerika yang berorientasi pada meritokrasi. Berbeda dengan nilai sekolah menengah yang bisa bervariasi, SAT memberikan standar yang seragam dan dapat diadakan dengan biaya relatif rendah untuk banyak siswa. Jika kemampuan belajar bisa diukur secara andal, SAT dapat membantu mengidentifikasi siswa dari latar belakang kurang beruntung yang tetap layak masuk perguruan tinggi, sehingga meningkatkan akses dan kesetaraan dalam penerimaan mahasiswa.

Lebih dari itu, SAT menawarkan alat prediksi bagi petugas penerimaan perguruan tinggi, membantu mereka membedakan antara pelamar yang kemungkinan besar akan berhasil atau mengalami kesulitan di tingkat perguruan tinggi. Tidak heran jika tes ini mendapat penerimaan luas di era pascaperang.

Perkembangan

SAT pertama kali dikembangkan oleh psikolog dari Princeton, Carl Campbell Brigham, yang juga menciptakan tes IQ. Tes ini awalnya menguji berbagai kemampuan, termasuk definisi kata, aritmetika, klasifikasi, bahasa buatan, antonim, deret angka, analogi, inferensi logis, dan membaca paragraf. Tujuan awal SAT adalah menghilangkan bias dalam tes bagi individu dari berbagai latar belakang sosial-ekonomi. Namun, Brigham kemudian mengkritik gerakan tes standar, yang menyebabkan perkembangan SAT terhambat hingga kematiannya pada tahun 1943.

Pada tahun 1946, Henry Chauncey, dekan di Harvard, menjadi presiden pertama dari Educational Testing Service (ETS), dan di bawah kepemimpinannya, SAT berkembang pesat. Sejak 1926, jumlah bagian dalam SAT telah mengalami berbagai perubahan, termasuk peningkatan batas waktu agar peserta memiliki kesempatan lebih besar untuk memperoleh skor tinggi.

Awalnya, bagian matematika dihilangkan dan hanya menguji kemampuan verbal (1928–1929). Namun, pada tahun 1930, bagian matematika dimasukkan kembali, dan format ini bertahan hingga 2004. Pada periode ini, bagian matematika juga disederhanakan menjadi hanya soal pilihan ganda.

Pada tahun 1946, pertanyaan membaca paragraf dan “double definition” dihapus, lalu diganti dengan pemahaman bacaan dan penyelesaian kalimat. Beberapa perubahan lainnya terus terjadi, dan pada tahun 1980, SAT disesuaikan agar memberikan kesempatan lebih besar bagi kelompok minoritas untuk diterima di perguruan tinggi bergengsi.

Perubahan besar lainnya terjadi pada tahun 1994, ketika soal matematika mulai mencakup pertanyaan non-pilihan ganda serta konsep baru seperti probabilitas, kemiringan garis (slope), statistika dasar, perhitungan, median, dan modus.

Awalnya, tes ini disebut “Scholastic Aptitude Test”, tetapi pada tahun 1990 namanya diubah menjadi “Scholastic Assessment Test”. Sejak 1993, hanya nama “SAT” yang digunakan tanpa kepanjangan resmi. Skor SAT juga mengalami penyesuaian ke skala 1600 poin, mencakup subskor dan skor lintas-tes untuk Matematika serta Evidence-Based Reading and Writing (ERW).

Saat ini, semua perguruan tinggi di Amerika Serikat menerima SAT sebagai ujian masuk, dan pada tahun 2015, sekitar 1,7 juta siswa SMA di Amerika mengikuti SAT untuk penempatan di perguruan tinggi atau universitas.

Komponen SAT

Bagian Verbal
Versi terbaru dari bagian verbal SAT mencakup:

  • Analogi: Mengukur keterampilan penalaran dan kosakata (19 soal).
  • Penyelesaian kalimat: Menguji pemahaman hubungan logis dan kosakata dalam konteks kalimat (19 soal).
  • Pemahaman bacaan: Berisi empat bacaan dengan panjang antara 400 hingga 800 kata, menguji keterampilan penalaran lanjutan, pemahaman harfiah, serta kosakata dalam konteks (40 soal). Dua bacaan disajikan berpasangan dengan perspektif yang berbeda (misalnya, dua sisi dari satu argumen), sementara satu bacaan berhubungan dengan isu minoritas.

Bagian Matematika
Sebelum tahun 1994, bagian matematika hanya berisi soal pilihan ganda (40 soal) dan perbandingan kuantitatif (20 soal). Materi yang diujikan mencakup aritmetika serta penalaran aljabar dan geometri, yang disajikan dalam dua sesi berdurasi 30 menit.

Setelah revisi, dua jenis soal ini tetap dipertahankan, tetapi dengan beberapa perubahan utama:

  • Peserta kini diperbolehkan menggunakan kalkulator.
  • Beberapa soal tidak lagi berbentuk pilihan ganda; peserta harus menuliskan sendiri jawaban mereka.
  • Terdapat 35 soal pilihan ganda, 15 soal perbandingan kuantitatif, dan 10 soal isian singkat atau “student-produced responses”.
  • Soal-soal matematika dibagi dalam dua sesi berdurasi 30 menit dan satu sesi berdurasi 15 menit.

Perubahan-perubahan ini bertujuan untuk lebih menekankan keterampilan pemecahan masalah dalam matematika.


Tes Potensi Akademik (TPA), Indonesia

Di Indonesia, Tes Potensi Akademik (TPA) adalah salah satu alat ukur untuk menilai kemampuan kognitif umum yang bersifat potensial (mengukur performa maksimal). Tes ini dirancang khusus untuk memprediksi peluang keberhasilan seseorang dalam belajar di perguruan tinggi.

Secara konseptual, TPA di Indonesia mengadaptasi prinsip dari Graduate Record Examinations (GRE), yang terdiri dari Verbal Reasoning (V), Quantitative Reasoning (Q), dan Analytical Writing (AW). Namun, dalam penerapannya, TPA mengalami beberapa modifikasi. Umumnya, TPA terdiri dari tiga subtes utama:

  • Subtes Verbal (mengukur pemahaman kata dan hubungan antar kata),
  • Subtes Kuantitatif (mengukur pemahaman konsep matematika dasar dan kemampuan berpikir numerik),
  • Subtes Penalaran (mengukur kemampuan berpikir logis dan analitis).

Mengapa TPA Digunakan sebagai Syarat Masuk Perguruan Tinggi?

TPA digunakan sebagai salah satu syarat masuk perguruan tinggi karena tes ini dirancang untuk mengukur kemampuan seseorang dalam menyelesaikan masalah kognitif secara cepat dan strategis. Kemampuan ini dikenal sebagai general reasoning ability, yang sangat diperlukan dalam lingkungan akademik tingkat lanjut.

Di perguruan tinggi, keberhasilan belajar lebih bergantung pada kemampuan berpikir kritis dan analitis, bukan sekadar mengikuti metode pembelajaran yang terstruktur seperti di sekolah menengah. Oleh karena itu, TPA lebih mengutamakan kemampuan penalaran daripada penguasaan materi pelajaran tertentu.

Berbeda dengan tes prestasi yang mengukur hasil belajar berdasarkan silabus suatu mata pelajaran, TPA tidak berbasis kurikulum tertentu. Oleh karena itu, keberhasilan dalam menjawab soal TPA tidak banyak dipengaruhi oleh seberapa luas seseorang menguasai mata pelajaran tertentu, melainkan lebih bergantung pada kemampuan berpikir logis dan analitis.

Sebagai contoh:

  • Soal Geometri dalam TPA dapat dijawab tanpa harus menghafal rumus-rumus geometri yang kompleks.
  • Soal Aritmetika dalam TPA tidak menuntut peserta untuk menggunakan rumus matematis secara langsung, tetapi lebih mengandalkan kemampuan penalaran dan strategi pemecahan masalah kuantitatif secara umum.
  • Soal Konsep Aljabar dalam TPA lebih berfokus pada pemahaman konsep dasar aljabar daripada sekadar menghafal dan menerapkan rumus-rumus hitungan.

Tantangan dalam Penggunaan TPA

Dalam praktiknya, tes abilitas seperti TPA sering digunakan untuk diagnosis individu dan seleksi akademik, meskipun sering kali tanpa melalui uji empiris yang ketat terhadap kualitas butir soal. Hal ini terjadi karena:

  • Kerahasiaan butir soal perlu dijaga agar tes tetap valid dan tidak bocor ke publik.
  • Keterbatasan data kriterion, sehingga sulit untuk melakukan validasi prediktif secara ideal.

Namun, meskipun ada keterbatasan, TPA tetap menjadi alat yang penting dalam seleksi akademik, karena dapat memberikan gambaran objektif tentang kemampuan berpikir calon mahasiswa di luar sekadar nilai akademik mereka.

SUMBER BACAAN

Atkinson, R. C., & Geiser, S. (2009). Reflections on a century of college admissions tests. Educational Researcher, 38(9), 665-676.

Ferdian, F. R., & Azwar, S. (2019). PAPS predictive validity in predicting the learning success of master of professional psychology students. Jurnal Penelitian dan Evaluasi Pendidikan, 23(2), 117-128.

McDonald, A. S., Newton, P. E., Whetton, C., & Benefield, P. (2001). Aptitude testing for university entrance: A literature review. Berkshire, UK: National Foundation for Educational Research.

van Schalkwyk, G. J. (2017). Scholastic Aptitude Test. Encyclopedia of Clinical Neuropsychology, 1-4.