Pergi ke kandungan

Bantuan:Panduan permulaan membaca pruf

Daripada Wikisumber

Bagaimana untuk membaca pruf karya di Wikisumber.

Pembacaprufan merupakan sesuatu perkara asas di Wikisumber, yang berupaya untuk menyediakan naskhah dengan kualiti terbaik di perpustakaan kami. Proses ini melibatkan dua "ruang nama" (kaedah pembahagian laman Wikisumber yang namanya disertakan pada permulaan tajuk laman) serta sebuah perisian khas. Kedua-dua ruang nama ini (Indeks dan Laman) kadangkala bersama-sama dikenali "ruang kerja". Di sinilah proses membaca pruf, penyuntingan dan lain-lain tugasan "balik tabir" dilakukan.

Proses ini berdasarkan imbasan helaian muka surat buku fizikal, biasanya dalam bentuk fail DjVu. Fail sebegini digunakan untuk membuat laman dengan ruang nama "Indeks", yang menggunakan nama sama dengan fail DjVu tersebut. Setiap muka surat individu dalam buku adalah helaian laman yang berasingan di bawah ruang nama "Laman" tersendiri. Laman Indeks akan memaut ke setiap satu laman muka surat tersebut dan setiap laman muka surat itu sendiri perlu dibaca pruf.

Panduan berikut akan menerangkan cara membaca pruf sesebuah laman, dengan penunjuk ke halaman lain dengan maklumat yang lebih terperinci. Untuk panduan kepada bahagian halaman Indeks untuk membaca pruf, lihat Help:Beginner's guide to Index: files.

Bagaimana untuk membaca pruf sesuatu laman

[sunting]
Nota: Untuk mendapatkan idea tentang cara proses ini berfungsi, mungkin boleh cuba beberapa laman pada indeks-indeks yang tersenarai.
Laman indeks yang memaparkan warna-warna status berbeza untuk setiap muka surat laman

Proses membaca pruf adalah berdasarkan laman Indeks dan semua laman yang ruang namanya Laman yang berpautan. Langkah pertama adalah dengan mencari satu laman untuk dibaca pruf. Anda mungkin akan bermula dari sebuah laman "indeks". Laman indeks tersebut menunjukkan gambar muka depan atau muka surat pertama. Di bawah gambar tersebut adalah senarai semua nombor muka surat yang mewakili setiap laman berkaitan.

  1. Pilih satu laman muka surat untuk disunting. Anda tidak semestinya perlu memilih laman muka surat pertama atau laman muka surat seterusnya mengikut senarai. Warna nombor laman muka surat itu akan memaparkan maklumat:
    • Latar belakang hijau seperti 14 bermaksud "disahkan" (selesai). Jika ternampak mana-mana daripada ini, anda boleh melihatnya untuk mendapatkan idea tentang matlamat utama.
    • Latar belakang kuning seperti 14 bermaksud "disemak" (pengguna Wikisumber pertama yang membaca pruf laman muka surat tersebut telah selesai, hanya perlu tunggu pengguna Wikisumber kedua untuk menyemak kali kedua atau "mengesahkan" kualiti transkripsi karya itu).
    • Latar belakang merah seperti 14 bermakna laman muka surat tersebut telah dicipta tetapi belum dibaca pruf sepenuhnya.
    • Latar belakang biru seperti 14 bermakna laman muka surat tersebut memerlukan bantuan daripada sukarelawan pakar kerana pemformatan yang rumit, imej hilang, dsb. ("bermasalah").
    • Latar belakang kelabu seperti 14 bermakna laman muka surat tersebut tidak memerlukan pembacaan pruf kerana ia tidak mengandungi teks.
    • Nombor merah pada latar belakang putih seperti 14 bermakna laman muka surat itu belum dicipta lagi. Jika anda masih baru dari segi proses membaca pruf, anda mungkin mahu memilih salah satu daripada laman-laman tersebut ini. Pautan merah ini akan membuka alat sunting secara automatik. Klik pada beberapa laman yang tersenarai, sehingga anda menemui laman muka surat yang menarik minat anda.
  2. Jika anda mengklik pada mana-mana nombor pada sesuatu laman Indeks, anda akan melihat satu imej berkaitan muka surat karya asal itu dipaparkan di sebelah kanan alat sunting yang mengandungi medan teks. Medan teks pada alat sunting tersebut mungkin masih kosong atau telah diisi secara automatik dengan teks yang ada pada muka surat asal tersebut.
    • Jika ia kosong: tulis teks yang anda lihat dalam imej ke dalam medan teks.
    • Jika ia tidak kosong: betulkan teks dalam medan teks supaya ia berpadanan dengan teks pada imej muka surat karya asal itu.
  3. Pratayang atau pralihat kerja anda, tetapkan status kepada "Disemak" (yang berwarna kuning), kemudian simpan. — sila lihat Bantuan:Membaca pruf dan Bantuan:Status laman untuk maklumat lanjut.
    • Jika anda belum selesai membaca pruf laman tersebut tetapi anda ingin menyimpannya, tetapkan status kepada "Belum dibaca pruf" (iaitu latar belakang merah).
  4. Ulang semula dua langkah terakhir untuk setiap laman dalam imbasan.

Susun atur bersebelahan

[sunting]
Tangkapan layar daripada ruang nama Laman, menunjukkan medan teks bersebelahan dengan imej laman muka surat yang diimbas.
(Rajah 1) Susun atur bersebelahan pada ruang nama Laman

Apabila anda melihat sesuatu laman dengan ruang nama Laman, skrin pelayar di depan mata anda akan dibahagikan kepada dua bahagian (rajah 1). Hasilnya, susun atur bersebelahan terhasil secara lalai yang membolehkan pengguna membaca pruf teks pada Wikisumber (bahagian kiri) dan membandingkannya dengan teks imbasan muka surat (bahagian kanan). Apabila anda mengklik "Paparkan Pralihat" pada laman di bawah ruang nama Laman, bahagian pralihat akan terpampang di bahagian paling bawah atau paling atas antara dua bahagian yang bersebelahan tersebut, bergantung kepada tetapan anda.

Membaca pruf

[sunting]

Untuk membaca pruf sesuatu laman, anda perlulah menyunting teks pada bahagian kiri tersebut supaya ia berpadanan dengan teks imbasan pada bahagian kanan seboleh mungkin.

Anda tidak perlu membuat salinan imbasan fotografik yang sama sepenuhnya. Wikisumber merupakan sebuah tapak sesawang, bukannya sebuah buku, maka kandungan teksnya adalah lebih penting daripada tipografi. Anda hanya perlu cuba mendekati format kandungan itu sedekat mungkin. Sesetengah perkara boleh diusahakan dalam format buku tetapi tidak dapat diusahakan pada Wikisumber. Contohnya, jika teks asalnya adalah terdiri daripada beberapa lajur teks (seperti format surat khabar), maka pengekalan pemformatan itu tidak perlu dan tidak dapat dilakukan dengan baik pada Wikisumber, kerana beberapa laman akan dikumpulkan bersama dalam ruang nama utama apabila proses membaca pruf selesai. Sebaliknya, gunakan perenggan biasa tanpa lajur, disusun mengikut susunan yang anda akan membaca laman tersebut secara semula jadi mengikut format web.

Status laman

[sunting]
Tangkapan layat daripada ruang nama Laman yang menunjukkan butang bulat status laman.
(Rajah 2) Butang-butang status laman

Apabila anda menyimpan laman tersebut, anda juga harus menetapkan status laman. Anda sepatutnya dapat lihat deretan butang bulat dengan warna tepat di atas butang simpan (rajah 2). Jika anda baru sahaja memulakan suntingan laman tetapi tanpa sebarang perubahan (atau perubahan tersebut tidak banyak), maka pilihlah butang merah (untuk status "Belum dibaca pruf"). Jika anda telah membaca pruf sepenuhnya laman tersebut dan membetulkan setiap ralat yang anda boleh cari, maka pilihlah butang kuning (untuk status "Disemak").

Terdapat beberapa laman yang telah dibaca pruf oleh orang lain. Anda boleh memeriksa laman-laman tersebut dan bawa status laman tersebut ke tahap seterusnya. Periksa betul-betul merentasi setiap aksara yang terkandung dalam teks laman tersebut untuk meneliti sekiranya masih terdapat sebarang ralat yang tertinggal atau perkara yang perlu diubah. Jika tiada ralat, atau anda telah membetulkan kesemua yang perlu diperbaiki, bawa status laman tersebut daripada "Belum dibaca pruf" (merah) kepada "Disemak" (kuning), atau "Disemak" (kuning) kepada "Disahkan" (hijau). Laman yang telah disahkan bermaksud telah selesai kerja transkripsi dan tiada suntingan yang diperlukan lagi. Laman kosong (kelabu) dan laman bermasalah (biru) merupakan kes khas; lihat Bantuan:Status laman untuk maklumat lanjut.

Pengatas dan pembawah

[sunting]

Laman kosong

[sunting]

Laman kosong boleh dibiarkan kosong dan ditetapkan kepada status laman "Tanpa teks" (kelabu). Laman ini akan diabaikan apabila semua laman muka surat ditransklusikan pada ruang nama utama.

Semua laman kosong adalah termasuklah kulit buku, melainkan kulit buku itu diilustrasikan. Maknanya semua laman dengan ilustrasi tidak termasuk dalam kategori laman kosong, maka laman berilustrasi tersebut harus dibaca pruf seperti biasa. Jika ilustrasi tidak tersedia pada masa ini, sila rujuk bahagian Laman bermasalah.

Laman bermasalah

[sunting]

Jika anda menghadapi masalah ketika membaca pruf sesuatu laman dan tidak dapat menyelesaikannya, anda boleh menetapkan status laman tersebut kepada "Bermasalah" (biru). Penandaan status ini akan memberi amaran kepada pengguna Wikisumber lain bahawa terdapat masalah wujud pada laman tersebut yang mungkin dapat diselesaikan oleh mereka.

Antara beberapa masalah umum termasuklah laman dengan ilustrasi (jika tiada fail imej tersedia), laman dengan ungkapan persamaan matematik, laman dengan teks bahasa asing (terutama teks yang tidak menggunakan sistem alfabet Latin) dan laman dengan pemformatan khas. Dalam sesetengah kes, terdapat juga templat khas yang boleh diletakkan untuk mengenal pasti masalah (lihat Templat masalah pada bahagian berikut). Templat-templat tersebut berguna kepada sesiapa sahaja yang sedang memeriksa laman tersebut dan mereka boleh menarik perhatian mereka yang dapat menyelesaikan masalah berkaitan.

Nota apabila melakukan transkripsi laman

[sunting]

Sila sertakan

[sunting]
  • Pemformatan teks seperti penebalan (bold) atau pencondongan (italic) teks: menggunakan kod '''tebal''' atau ''italik''.
  • Saiz teks yang berbeza, sila guna {{smaller}} atau {{larger}}
  • Tipografi khusus, contohnya:
    • Parap jatuh (dropped initial) atau parap naik (raised initial)
    • Penghurufbesaran. Sekiranya huruf-huruf besar tersebut mempunyai saiz yang sama dengan teks biasa, sila guna {{smallcaps}}
    • Garis mendatar: {{rule}}
    • Pemisahan bahagian (sebaris asterisk: * * * * * )
  • Untuk maklumat lanjut berkenaan templat pemformatan teks, sila lihat Bantuan:Templat

Jangan sertakan

[sunting]
  • Sebarang tanda atau tokok tambah yang bukan sebahagian daripada buku asal, termasuklah tulisan tangan, plat buku ex libris, setem perpustakaan, kesan warna, cakaran, tera air, kotoran, dan sebagainya. Proses pengimbasan tidak sempurna dan akan cuba "mentafsir" tanda pada sesebuah laman muka surat. Titik, lubang dan calitan pada laman muka surat asal boleh tukar teks asal menjadi mempunyai salah ejaan, ruang jarak tambahan atau tanda baca (seperti tanda koma, tanda noktah dan tanda sempang). Perkara-perkara sedemikian boleh menjadi sangat rumit, maka pemeriksaan teliti terhadap teks asal adalah suatu perkara penting.
  • Lajur teks (seperti format lajur pada surat khabar) tidak diperlukan. Lajur teks hendaklah bersambungan sahaja daripada lajur sebelumnya pada laman tersebut. (Sila sertakan jadual dan maklumat yang mungkin dibentangkan dalam bentuk lajur.)
  • Jangan betulkan ejaan. Gunakan templat {{SIC}} untuk menandakan ejaan betul.

Pilihan

[sunting]
  • Pemisah baris. Laman web biasanya akan mengabaikan pemisah baris tunggal, jadi teks yang dipecahkan kepada baris yang berbeza (yang selalu dijumpai pada teks imbasan) akan dilihat secara normal oleh pembaca. Pemisahan baris boleh menyebabkan masalah (terutamanya dengan templat, pautan dan jadual, serta pencondongan/penebalan huruf yang ditutup dengan penghujung baris) tetapi mengalih keluar akan pemisah baris boleh jadi sesuatu yang bermasalah bagi pembaca pruf individu.
Contoh
Asli "Hello," said the example. This is
an example of a broken line.
Pembetulan "Hello," said the example. This is an example of an unbroken line.
  • Laman yang bukan sebahagian daripada karya itu sendiri, seperti iklan, tidak perlu dibaca pruf atau disertakan dalam versi utama. Namun, jika pembaca pruf masih ingin membaca pruf dan menyertakan laman ini, hal tersebut juga dibenarkan.
  • Tipografi lanjutan. Mencipta laman yang kelihatan seperti yang asli adalah sesuatu bagus. Walau bagaimanapun, kandungan teks itu sendiri adalah lebih penting. Sesetengah tipografi mungkin sukar untuk dihasilkan dan/atau menyebabkan masalah apabila ingin dipaparkan melalui tapak web.

Ralat OCR umum

[sunting]

Pengecaman Aksara Optik (OCR) merupakan sebuah fungsi yang digunakan oleh komputer untuk membaca teks. Ia selalunya disimpan dalam fail DjVu dan dapat diekstrak oleh komputer apabila sebuah laman baharu bermula proses membaca pruf. Walau bagaimanapun, komputer tidak begitu mahir membaca teks bercetak dan ralat (kadangkala dipanggil "skanos") boleh berlaku dengan kerap. Jadual berikut menunjukkan beberapa ralat biasa yang dibuat oleh komputer yang perlu dicari dan diperbetulkan semasa membaca pruf.

Contoh
Ralat OCR Pembetulan
tlie the
a11, aH, aU all
au an
\vas was
mc me

Beberapa perkara umum untuk dibetulkan

[sunting]
  • Pemisah perenggan. Sebuah baris kosong harus dikekalkan di antara perenggan, sebagai standard untuk pemformatan elektronik dan internet.
  • Ruang sebelum tanda baca biasanya perlu dialih keluar.
Contoh
Ralat OCR foo bar ; lorem ipsum
Dibetulkan foo bar; lorem ipsum
Ruang jarak sebelum koma bernoktah telah dialih keluar.

Templat

[sunting]

Terdapat beberapa templat yang diperlukan apabila membaca pruf sesuatu laman.

Templat pembacaprufan

[sunting]

Templat masalah

[sunting]

Templat tersebut perlu digunakan jika terdapat masalah yang anda sendiri tidak dapat selesaikan. Apabila menggunakan salah satu daripada templat berikut, sila tetapkan kemajuan kepada "bermasalah" (biru).

Templat Gunakan apabila..
{{missing image}} ..sebuah imej perlu disertakan.
{{missing table}} ..sebuah jadual perlu disertakan.†
{{missing score}} ..sebuah skor muzik perlu disertakan.
{{missing math formula}} ..sebuah formula matematik perlu disertakan.
{{illegible}} ..teks tidak boleh dibaca.
{{arabic missing}} ..tulisan bahasa Arab digunakan.*
{{chinese missing}} ..tulisan bahasa Cina digunakan.*
{{greek missing}} ..tulisan bahasa Yunani digunakan.*
{{hebrew missing}} ..tulisan bahasa Ibrani digunakan.*
{{russian missing}} ..tulisan Siril digunakan.*
{{symbol missing}} ..simbol yang tidak diketahui digunakan.
† Memandangkan ia melibatkan masalah pemformatan, bukannya masalah kandungan teks itu sendiri, tandakan laman tersebut sebagai "belum dibaca pruf" dan bukannya "bermasalah".
* Apabila anda tidak boleh membaca atau menulis dalam bahasa ini.