TEORI PENUNJANG
2.1. Finite State Automaton
Secara umum representasi scanner dinyatakan dengan menyusun suatu
diagram transisi atau transition diagram yang disebut finite automaton.
Finite Automaton memiliki konsep sebagai bentuk yang paling sederhana
dari peralatan komputerisasi abstrak. Meskipun teori finite automaton hanya
berhubungan secara langsung dengan mesin-mesin sederhana, ini merupakan
dasar penting dari banyak aplikasi baik konkrit maupun abstrak. Finite-state
control dari suatu finite automaton juga merupakan inti dari begitu banyak
peralatan komputer yang kompleks, salah satu di antaranya yaitu mesin Turing.
Pengaplikasian finite automata dapat ditemukan pada algoritma-algoritma
yang digunakan untuk pencocokan string pada perangkat lunak editor teks dan
perangkat lunak pengecekan ejaan, serta dapat ditemui juga pada penganalisa
sintaks yang digunakan oleh assemblers atau compilers. Meskipun finite automata
pada umumnya dianggap sebagai peralatan komputer abstrak, ia juga banyak
ditemui pada aplikasi-aplikasi non-komputer, seperti pengatur sinyal lampu lalu-
lintas dan mesin vending.
Automaton memiliki satu alur khusus dan unik untuk setiap kata yang akan
dikenali atau diterima, Jika suatu alur berakhir pada suatu state yang disebut
sebagai final state atau accepting state, maka kata yang ditelusuri tersebut
dikatakan dikenali oleh automaton.
Komponen dasar yang dimiliki oleh Finite Automaton adalah alphabet
yaitu himpunan simbol/lambang yang dikenali. Himpunan alfabet diwakili dengan
∑, jika dan hanya jika ∑ merupakan himpunan simbol yang bersifat tetap dan
bukan merupakan himpunan kosong. Contoh umum dari alphabet di sini adalah
26 (dua puluh enam) huruf yang dikenali dalam bahasa Indonesia ataupun
rangkaian karakter ASCII, yang merupakan rangkaian standar dari kode-kode
komputer. Sedangkan sebuah word, yang disebut juga string atau sentence adalah
rangkaian satu atau lebih alphabet yang telah dinyatakan sebelumnya. Rangkaian
Page 2
7
word itu sendiri disebut bahasa (language), yang diwakili dengan L. Berikut ini
adalah contoh alphabet beserta words yang dapat dibentuknya:
• ∑ = {a, b}, maka contoh words yang dapat dibentuknya yaitu “aab”, “abab”,
“a”, “bbbbbb”, dan lain-lain.
• ∑ = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, maka contoh words yang dapat dibentuknya
yaitu “26498098”, “100103”, “0000”, dan lain-lain.
Lebih lanjut, concatenation adalah proses menggabungkan dua buah word
menjadi satu word baru, yaitu yang terdiri dari rangkaian alphabet dari word
pertama dan disambung dengan rangkaian alphabet dari word ke-dua.
• ∑ = {a, b}, words x = “aaa” dan y = “bbb” dimana setiap a merupakan
anggota himpunan ∑, a∈∑ dan setiap b anggota himpunan ∑, b∈∑. Maka
gabungan atau concatenation x dan y, dinyatakan dengan x.y = “aaabbb”.
Setelah memiliki pemahaman di atas, maka definisi dari sebuah Finite
Automaton dapat ditetapkan sebagai suatu model matematis dari sebuah mesin
yang menerima suatu rangkaian words tertentu yang mengandung alphabet ∑.
Finite Automaton memiliki lima komponen, yaitu antara lain:
a. ∑, merupakan himpunan alphabet input (himpunan simbol/lambang yang
tetap dan bukan merupakan himpunan kosong)
b. S, merupakan himpunan state yang tetap dan bukan merupakan himpunan
kosong.
c. S0, merupakan state awal (start state atau initial state), merupakan anggota
dari S.
d. δ, merupakan fungsi transisi antar state; δ: S x ∑ → S.
e. F, merupakan himpunan state akhir (final state atau accepting state),
merupakan sub-himpunan dari S.
Secara visual, suatu bagan Finite Automaton diwakili dengan suatu graf
berarah dengan rumus G=; dimana V=S dan E={ | s,t∈S, a∈∑ ∧
δ(s,a) = t}. “V” merupakan himpunan verteks pada graf, “E” merupakan
himpunan sisi pada graf yang pada dasarnya merupakan fungsi-fungsi transisi
antara state yang satu ke state yang lain (state “s” dan “t”, yang masing-
masingnya merupakan anggota dari “S”). Selain itu, setiap sisi graf diberi nama
Page 3
8
dengan alphabet penghubung (alphabet “a”) antara dua verteks yang
dihubungkannya.
Pada umumnya, dalam suatu bagan Finite Automaton terdapat minimal
satu state akhir. Verteks graf yang menunjukkan suatu state, tetapi bukan state
akhir, dinyatakan dengan lingkaran , sedangkan yang menunjukkan suatu
state akhir dinyatakan dengan lingkaran ganda , sisi graf yang menunjukkan
fungsi transisi dinyatakan dengan tanda panah
.
Jadi suatu state dapat menjadi asal dan tujuan dalam suatu fungsi transisi
yang melibatkan dua buah state. Ditinjau dari sudut pandang state asal, maka
setiap state (kecuali state akhir) pasti menjadi state asal dan memiliki fungsi
transisi ke state yang lain, sedangkan state akhir dapat tidak memiliki fungsi
transisi ke state yang lain. Ditinjau dari sudut pandang state tujuan, maka setiap
state (kecuali state awal) pasti menjadi state tujuan.
Finite automaton dibedakan menjadi dua macam, yaitu:
- NFA (Nondeterministic Finite Automaton)
- DFA (Deterministic Finite Automaton)
2.1.1. NFA (Nondeterministic Finite Automaton)
Pada NFA terdapat kemungkinan lebih dari 1 transisi yang keluar dari
sebuah state dengan sumber input yang sama. Berikut ini adalah contoh NFA
Gambar 2.1 Bagan NFA yang menerima aa* | bb* [1]
Page 4
9
Berikut ini adalah tabel transisi NFA:
Tabel 2.1. Tabel Transisi NFA (aa* | bb*)
δ
λ
a
B
0
1,3
-
-
1
-
2
-
2
-
2
-
3
-
-
4
4
-
-
4
Keterangan:
Bagan pada Gambar 2.1. di atas sudah merupakan bagan NFA, karena ada state
asal yang memiliki tujuan ke lebih dari satu state tujuan dengan alphabet
penghubungan yang sama (λ).
Pada gambar diatas state 0 sebagai start state dan state 2 serta state 4
adalah final state. Disini digambarkan NFA menerima suatu input berupa aa* |
bb*. Suatu string “aaa” akan diterima dengan melalui state 0,1,2,2, dan 2. atau
bila NFA menerima string “bbbb” maka akan melalui state 0,3,4,4,4, dan 4. NFA
mempunyai kelebihan dapat melakukan backtracking, namun aksesnya lebih
lambat dibandingkan dengan DFA (Deterministic Finite Automaton).
2.1.2. DFA (Deterministic Finite Automaton)
Pada suatu NFA, suatu state dapat memiliki tujuan ke beberapa state yang
berbeda dengan alphabet penghubung yang sama. Akan tetapi, hal ini tidak
diperbolehkan pada suatu DFA. Untuk menyederhanakan suatu NFA menjadi
suatu DFA dipergunakan Tabel Transisi yang memiliki kolom berupa variasi
alphabet yang diterima dan baris berupa nama-nama state asal. Sedangkan titik
temu antara suatu kolom dan baris diisi dengan nama-nama state tujuan dari state
asal yang tertera pada bagian baris dengan alphabet penghubung yang tertera pada
bagian kolom. Berikut ini adalah contoh suatu DFA yang akan mengenali suatu
bilangan cacah.
Page 5
10
• DFA Bilangan Cacah = <∑, S, S0, F>
∑ = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
S = {S0, S1, S2}
S0 = S0
F = {S1, S2}
Berikut ini adalah bagan DFA untuk Bilangan Cacah:
Gambar 2.2. Bagan DFA Bilangan Cacah [3]
Berikut ini adalah tabel transisi DFA untuk Bilangan Cacah:
Tabel 2.2. Tabel Transisi DFA Bilangan Cacah [3]
δ
0
1..9
S0
S1
S2
S1
-
-
S2
S2
S2
Keterangan:
Bagan pada Gambar 2.2. di atas sudah merupakan bagan DFA yang benar
karena tidak ada state asal yang memiliki tujuan ke lebih dari satu state tujuan
dengan alphabet penghubungan yang sama.
2.2. Parsing Algorithm
Secara umum, analisa struktur secara sintaksis dilakukan pada tahap
parsing. Yang merepresentasikan struktur tersebut adalah Context Free Grammar.
Output dari parser adalah representasi dari parse tree untuk sederetan token yang
Page 6
11
dihasilkan scanner. Parsing algorithm dibedakan menjadi 2 jenis, yaitu Top-
Down parser dan Bottom-Up parser.
2.2.1 Context Free Grammar
Untuk merepresentasikan sintaks bahasa dikenal suatu notasi yang disebut
Context Free Grammar (CFG), dengan adanya CFG maka memungkinkan untuk
membentuk sebuah pohon parser (parse tree). CFG adalah satu dari empat tipe
grammar (tata bahasa) yang ditentukan oleh Noam Chomsky (MIT) pada tahun
1950.
CFG memiliki komponen-komponen sebagai berikut:
a. Terminals.
Terminals adalah simbol dasar yang menjadi pembentuk string –disebut juga
word. Terminal dikenal juga dengan istilah ‘token’.
b. Nonterminals.
Nonterminal adalah variabel sintaksis yang menunjukkan kumpulan string.
Nonterminal memerlukan sekumpulan string yang membantu menentukan
language yang dihasilkan oleh grammar.
c. Start symbol.
Dalam sebuah grammar, salah satu nonterminal berfungsi sebagai start
symbol, dan kumpulan string yang ditunjukkannya adalah language yang
ditentukan oleh grammar.
d. Productions.
Productions pada sebuah grammar berfungsi untuk menentukan cara-cara
dimana terminals dan nonterminals dapat dikombinasikan untuk membentuk
string. Tiap productions terdiri atas sebuah nonterminal, yang diikuti oleh
tanda panah (terkadang simbol ::= digunakan untuk menggantikan tanda
panah), lalu diikuti oleh sebuah string yang terdiri atas nonterminals dan/atau
terminals.
Berikut ini adalah contoh grammar dengan productions untuk ekspresi
aritmetik sederhana:
expr → expr op expr
expr → ( expr )
expr → – expr
Page 7
12
expr → id
op → +
op → –
op → *
op → /
Keterangan:
Pada productions ini, yang termasuk dalam simbol nonterminal adalah expr dan
op, selain itu expr juga berlaku sebagai start symbol. Sedangkan simbol
terminalnya adalah id, +, –, *, /, (, dan )
2.2.2. Top-Down Parser
Top-Down Parser membangun parse tree dengan dimulai dari root
kemudian membangun node-node dari parse tree secara preorder. Salah satu
bentuk umum top-down parser adalah recursive-descent parser, dimana masih
menggunakan backtracking. Bagaimanapun, bactracking parser tidaklah sering
ditemui. Hal ini dikarenakan backtracking jarang diperlukan untuk mem-parse
konstruksi bahasa pemrograman. Kasus khusus recursive-descent parser adalah
predictive parser, dimana predictive parser merupakan salah satu recursive-
descent parser yang tidak menggunakan backtracking.
2.2.2.1. Predictive parser
Untuk membuat sebuah predictive parsers, simbol input sekarang, a dan
nonterminal A haruslah dikembangkan, dimana salah satu alternatif dari produksi
A → α1 | α2 | … | αn adalah alternatif khusus yang menderivasikan sebuah string
yang dimulai dengan a, alternatif yang tepat haruslah diperkirakan dengan
melihat hanya pada simbol pertama yang diderivasikannya. Sebagai contoh, jika
kita memiliki produksi
stmt → if expr then stmt else stmt
| while expr do stmt
| begin stmt end
maka keyword if, while, dan begin memberitahu kita mana alternatif yang hanya
satu yang dapat berhasil jika kita mencari sebuah pernyataan.
Untuk parser, diagram transisi dibuat untuk masing-masing nonterminal.
Label pada ujung diagram transisi adalah token (terminal) dan nonterminal.
Page 8
13
Sebuah transisi pada sebuah token (terminal) berarti kita harus mengambil transisi
tersebut jika token tersebut adalah simbol input berikutnya. Sebuah transisi pada
sebuah nonterminal A dipanggil oleh sebuah prosedur untuk A.
Untuk membuat diagram transisi sebuah predictive parser dari sebuah
grammar, pertama-tama adalah mengurangi rekursi di sebelah kiri dari grammar
dan kemudian faktor sebelah kiri dari grammar. Kemudian untuk tiap nonterminal
A dilakukan hal berikut ini:
a. Buat sebuah initial dan final state.
b. Untuk tiap produksi A → X1 X2 … Xn , buat sebuah garis dari initial ke
final state, dengan garis berlabel X1, X2, …, Xn.
Sebuah program predictive parsing berdasarkan pada sebuah diagram
transisi bertujuan untuk mencocokkan simbol terminal dengan input dan
memanggil sebuah prosedur disaat harus diikuti dengan sebuah garis berlabel
nonterminal. Pendekatan tersebut akan berhasil dengan catatan tidak ada
nondeterminan, dengan kata lain tidak ada lebih dari satu transisi untuk satu input.
Sebagai contoh, kita memiliki grammar berikut ini:
E → T E’
E’ → + T E’
T → F T’
T’ → * F T |
F → ( E ) | id
maka diagram transisi dari grammar diatas adalah sebagai berikut:
Gambar 2.3 Diagram Transisi [1]
Page 9
14
2.2.2.2. Nonrecursive predictive parser
Sebuah predictive parser memiliki sebuah input buffer, sebuah stack,
sebuah parsing table dan sebuah output stream. Input buffer berisi string yang
akan di-parsing, yang diikuti tanda $, simbol yang digunakan sebagai right
endmarker untuk menandakan akhir dari string input. Stack berisi sederet symbol
grammar dengan $ pada bagian paling bawah, yang menunjukkan bagian paling
bawah stack. Mula-mula, stack berisi start symbol dari grammar di atas tanda $.
Parsing table adalah array dua dimensi M[A,a], dimana A adalah nonterminal
dan a adalah terminal atau tanda $.
Konstruksi sebuah predictive parser ditambah dua buah fungsi yang
berkaitan dengan sebuah grammar, G. Fungsi-fungsi tersebut, fungsi First dan
fungsi Follow, memungkinkan kita untuk mengisi isian pada sebuah predictive
parsing table untuk G, kapanpun memungkinkan.
2.2.3. Bottom-Up Parser
Bottom-Up Parser membangun parse tree dimulai dari bawah dan naik
sampai ke root. Langkah-langkah Bottom-Up Parser dapat kita lihat pada contoh
berikut ini, misalnya terdapat grammar berikut ini:
S → aABe
A → aBc | b
B → d
Sentence abbcde dapat menjadi S dengan langkah-langkah berikut ini:
abbcde
aAbcde
aAde
aABe
S
Keterangan:
abbcde kita scan untuk mencari substring yang cocok pada bagian kanan beberapa
production. Setelah menemukannya, kita gantikan dengan substring pada bagian
kiri production yang cocok itu. Langkah tersebut terus diulang sampai sentence
abbcde menjadi S.
Page 10
15
2.3. Tata Bahasa Baku Bahasa Indonesia
Tatabahasa Indonesia terdiri atas tiga unsur, yaitu fonologi, morfologi,
dan sintaksis. Namun, dalam tugas akhir ini hanya akan dibahas mengenai
morfologi dan sintaksis.
2.3.1. Morfologi
Bagian dari tatabahasa yang membahas bentuk kata disebut morfologi.
Didalam morfologi dikenal istilah morfem, dimana morfem adalah kesatuan yang
ikut serta dalam pembentukkan kata dan yang dapat dibedakan artinya. Morfem
sendiri berasal dari kata morphe yang berarti ‘bentuk’, dan akhiran -ema yang
berarti ‘yang mengandung arti’. Dalam bahasa Indonesia kita mendapati dua
macam morfem, yaitu morfem dasar atau morfem bebas seperti kerja, puas bapa,
kayu,dan lain-lain; serta morfem terikat seperti pe-, -an, pe-an, ter-, ber-, me-, dan
lain-lain. Morfem bebas bisa langsung membina sebuah kalimat, sebaliknya
morfem terikat tidak dapat berdiri sendiri, harus diikatkan dengan morfem bebas
terlebih dahulu. Dalam tatabahasa Indonesia, morfem dasar atau morfem bebas
disebut kata dasar, sedangkan morfem terikat disebut imbuhan.
Selain istilah morfem, terdapat istilah alomorf. Alomorf adalah variasi
bentuk dari suatu morfem disebabkan oleh pengaruh lingkungan yang
dimasukinya. Misalnya morfem ber- dalam realisasinya dapat mengambil
bermacam-macam bentuk: ber-, be-, bel-. Dalam morfologi dibicarakan
bagaimana hubungan antara morfem dengan morfem, antara morfem dengan
alomorf, serta bagaimana menggabungkan morfem-morfem itu untuk membentuk
suatu kata.
Seperti yang telah dijelaskan sebelumnya, morfem dibedakan menjadi
dua, yaitu morfem bebas dan morfem terikat. Morfem terikat dalam tatabahasa
Indonesia dapat dibagi lagi atas empat macam berdasarkan tempat terikatnya pada
sebuah morfem dasar, yaitu awalan (prefiks), sisipan (infiks), akhiran (sufiks), dan
konfiks, dimana konfiks adalah gabungan dari dua atau lebih dari ketiga macam
morfem terikat lain yang bersama-sama membentuk suatu kesatuan arti.
Page 11
16
2.3.1.1. Kata
Kata adalah kesatuan-kesatuan terkecil yang diperoleh sesudah sebuah
kalimat dibagi atas bagian-bagiannya, dan mengandung suatu ide. Suatu morfem
bebas sudah merupakan suatu kata, tetapi sebaliknya konsep tentang kata tidak
hanya meliputi morfem bebas melainkan juga semua bentuk gabungan antara
morfem bebas dan morfem terikat, atau morfem dasar dengan morfem dasar. Kata
berdasarkan bentuknya dapat dibagi menjadi:
a. Kata dasar, umumnya terdiri atas dua suku kata, misalnya rumah, lari, nasi dan
sebagainya.
b. Kata berimbuhan, yang dapat dibagi lagi menjadi kata yang berawalan, kata
yang berakhiran, kata yang bersisipan dan kata yang berkonfiks.
c. Kata ulang
d. Kata majemuk
Pembagian jenis kata:
- Kata benda (nomina)
Kata benda adalah nama dari semua benda dan segala yang dibendakan.
Dalam bahasa Indonesia ada nomina yang terdiri atas kata dasar (satu morfem)
yang disebut nomina dasar dan ada yang terdiri atas dua morfem atau lebih
yang disebut nomina turunan. Nomina turunan dibentuk dari nomina dasar
atau kategori kata yang lain, khususnya verba dan adjektiva. Selain itu, ada
pula kata lain seperti numeralia dan konjungsi, tetapi jumlahnya tidak banyak.
Umumnya nomina turunan dibentuk dengan menambahkan prefiks, sufiks
atau konfiks pada bentuk dasar (umumnya bentuk dasar yang diturunkan dari
verba atau verba turunan). Sehingga kita akan memperoleh nomina turunan
seperti pembeli, pembelian dan sebagainya.
- Kata kerja (verba)
Kata kerja adalah semua kata yang menyatakan perbuatan atau laku. Bahasa
Indonesia memiliki dua macam bentuk verba, yakni verba asal, verba yang
dapat berdiri sendiri tanpa afik dalam konteks sintaksis dan verba turunan,
verba yang dibentuk dengan menambahkan afiks pada dasar kata atau
kelompok kata. Apabila suatu kata kerja menghendaki adanya suatu pelengkap
maka disebut kata kerja transitif, misalnya memukul, menangkap, melihat,
Page 12
17
mendapat dan sebagainya. Sebaliknya jika tidak memerlukan suatu pelengkap
maka disebut kata kerja intransitif, misalnya: menangis, meninggal, berjalan,
berdiri dan sebagainya.
- Kata sifat (adjektiva)
Kata sifat adalah kata yang dipakai untuk mengungkapkan sifat atau keadaan
orang, benda, atau binatang.
- Kata keterangan (adverbia)
Kata keterangan adalah kata-kata yang memberi keterangan tentang kata kerja,
kata sifat, kata keterangan, kata bilangan dan seluruh kalimat.
- Kata ganti (pronomina)
Kata ganti adalah segala kata yang digunakan untuk menggantikan kata benda
atau yang dibendakan.
- Kata bilangan (numeralia)
Kata bilangan adalah kata yang menyatakan jumlah benda atau jumlah
kumpulan atau urutan tempat dari nama-nama benda.
- Kata depan (preposisi)
Kata depan adalah kata yang merangkaikan kata-kata atau bagian-bagian
kalimat. Kata depan yang terpenting dalam bahasa Indonesia adalah di, ke,
dari, pada. Selain itu ada beberapa kata depan yang menduduki bermacam-
macam fungsi yang istimewa, antara lain akan, dengan, atas, antara.
- Kata sambung (konjungsi)
Kata sambung adalah kata yang menghubungkan kata-kata, bagian-bagian
kalimat, atau menghubungkan kalimat-kalimat.
2.3.1.2. Imbuhan (Afiks)
Imbuhan terbagi atas:
a. Awalan (Prefiks).
Awalan adalah suatu unsur struktural yang diikatkan di depan sebuah kata
dasar atau bentuk dasar. Yang dimaksud disini adalah hubungan antar awalan dan
kata dasar adalah hubungan struktural, yaitu bahwa semua unsur (awalan dan
kata dasar) merupakan bagian dari kata turunan (kata yang berawalan).
Page 13
18
Yang termasuk di dalam awalan adalah ber-, me-, pe-, per-, di-, ke-, ter-
dan se-. Didalam menambahkan awalan pada suatu bentuk dasar, ada suatu proses
yang terkadang ikut andil didalamnya, proses yang dimaksud adalah proses
nasalisasi. Proses nasalisasi inilah yang akan menyebabkan bervariasinya bentuk
awalan, bentuk-bentuk variasi itu disebut dengan Alomorf.
Untuk awalan ber- terdapat tiga macam bentuk yaitu be-, ber-, dan bel-.
Awalan me- dan pe- memiliki bentuk yang lebih banyak lagi karena mengalami
proses nasalisasi. Bentuk awalan me- antara lain me-, mem-, men-, meng-, meny-,
dan menge- sedangkan bentuk awalan per- antara lain pe-, per-, pem-, pen-, peng-,
peny-, dan penge-. Sedangkan untuk bentuk awalan lainnya tidak mengalami
perubahan bentuk setelah ditambahkan pada kata dasar.
b. Sisipan (Infiks).
Sisipan adalah semacam morfem terikat yang disisipkan pada sebuah kata
antara konsonan pertama dengan vokal pertama. Jenis morfem ini pemakaiannya
terbatas pada beberapa kata saja. Sisipan yang terdapat dalam bahasa Indonesia
adalah -el-, -er-, dan -em-.
c. Akhiran (Sufiks).
Akhiran adalah semacam morfem terikat yang dilekatkan di belakang
suatu morfem dasar. Macam-macam akhiran yang terdapat dalam bahasa
Indonesia adalah akhiran -an, -kan, -i.
d. Konfiks.
Konfiks adalah gabungan prefiks dan sufiks yang mengapit kata dasar dan
membentuk satu kesatuan, awalan dan akhiran dilekatkan secara serentak pada
kata dasar, selain itu pemenggalan salah satu afiks tidak akan meninggalkan
bentuk yang masih berwujud kata yang maknanya masih dapat ditelusuri. Yang
termasuk konfiks adalah ke-an dan per-an.
e. Gabungan imbuhan.
Gabungan imbuhan adalah pemakaian beberapa imbuhan sekaligus pada
suatu kata dasar, yang masing-masing mempertahankan arti dan fungsinya.
Imbuhan-imbuhan yang biasa dipakai bersama-sama adalah me-kan, di-kan, mem-
per-kan, di-per-kan, mem-per-i, di-per-i, ber-kan, dan ber-an.
Page 14
19
Bentuk-bentuk alomorf dari imbuhan-imbuhan diatas dapat kita lihat pada
tabel berikut ini:
Tabel 2.3. Tabel Bentuk Alomorf dari Imbuhan
Imbuhan
Alomorf
be-
bel-
1. be-
ber-
me-
mem-
men-
meng-
menge-
2. meN-
meny-
pe-
3. peN-
pem-
pen-
peng-
penge-
peny-
per-
te-
tel-
4. ter-
ter-
Keterangan:
Pada tabel diatas morfem pe- dan me- selain mempunyai bentuk alomorf sendiri
juga mengalami nasalisasi yang menyebabkan bentuk alomorf-nya bertambah.
Data tabel diperoleh dari referensi Tata Bahasa Indonesia halaman 94-106.
2.3.1.3. Nasalisasi
Nasalisasi adalah proses merubah atau memberi nasal pada fonem-fonem.
Dalam menasalkan suatu fonem haruslah mengikuti kaidah-kaidah tertentu. Tiap
fonem yang dinasalkan harus mengambil nasal yang homorgan, maksudnya nasal
yang mempunyai articulator dan titik artikulasi yang sama dengan fonem yang
dinasalkan itu. Misalnya p dan b harus mengambil nasal m (karena sama-sama
bilabial), t dan d harus mengambil nasal n (karena sama-sama dental), k dan g
harus mengambil nasal ng (karena sama-sama velar) dan sebagainya. Nasalisasi
hanya berlangsung pada kata-kata dasar, atau yang dianggap kata dasar.
Page 15
20
Dalam proses nasalisasi terdapat konsonan yang mengalami peluluhan dan
ada juga yang tidak setelah mengalami nasalisasi. Hal ini terjadi dikarenakan
adanya konsonan bersuara dan konsonan tidak bersuara, konsonan yang bersuara
tidak akan mengalami peluluhan setelah proses nasalisasi karena bersifat sama
dengan konsonan nasal (bersuara), sebaliknya konsonan tidak bersuara harus
disesuaikan dengan fonem nasal yang bersuara. Yang termasuk fonem-fonem
bersuara adalah b, d, g, dan j. Sedangkan fonem yang tidak bersuara adalah p, t, k,
dan s. Selain itu Fonem-fonem y, r, l, dan w dianggap mengalami proses
nasalisasi juga, tetapi nasalisasi yang zero (tidak ada). Sedangkan kata-kata yang
dimulai dengan vokal atau fonem /h/ akan mengambil nasal ng. Keseluruhannya
dapat kita lihat pada tabel berikut ini:
Tabel 2.4. Tabel Nasalisasi
Fonem awal
Nasalisasi
Keterangan
1. /b/,/f/,/p/
m
fonem /p/ dapat mengalami
peluluhan
2. /c/,/d/,/j/,/t/
n
fonem /t/ dapat mengalami
peluluhan
3. /a/,/e/,/g/,/h/,/i/,/k/,/o/,/u/
ng
fonem /k/ dapat mengalami
peluluhan
4. /s/
ny
fonem /s/ dapat
mengalami peluluhan
5. /m/,/n/,/ng//ny/,/l/,/r/,/y/,/w/ tidak ada
Keterangan:
Data tabel diperoleh dari referensi Tata Bahasa Indonesia halaman55-57.
Pada prinsipnya, proses peluluhan hanya berlaku pada kata-kata dasar,
bukan pada afiks. Demikian juga kata-kata asing yang terasa masih asing, tetap
mempertahankan konsonan-konsonan tak bersuara untuk menjaga jangan sampai
menimbulkan salah paham. Misalnya saja kata-kata asing sabot, koordinir yang
tetap mempertahankan fonem awalnya walaupun fonem itu tidak bersuara.
Sedangkan untuk kata yang fonem awalnya /p/, dimana fonem tersebut
merupakan fonem awal dari penambahan imbuhan (per) maka fonem /p/ juga
tidak luluh meskipun fonem /p/ merupakan fonem tidak bersuara.
Page 16
21
2.3.2. Sintaksis
Sintaksis adalah bagian dari tatabahasa yang memperlajari dasar-dasar dan
proses-proses pembentukan kalimat dalam suatu bahasa. Setiap bahasa memiliki
sistem khusus untuk mengikat kata atau kelompok kata ke dalam suatu gerak yang
dinamis. Sintaksis bahasa haruslah merupakan perumusan dari berbagai macam
gejala susun-peluk kata-kata dalam suatu bahasa. Sebab itu tidak dibenarkan
menerapkan sintaksis suatu bahasa pada bahasa lain. Berdasarkan strukturnya,
frasa dan klausa serta kalimat termasuk dalam sintaksis.
2.3.2.1. Frasa dan Klausa
Frasa adalah suatu konstruksi yang terdiri dari dua kata atau lebih yang
membentuk suatu kesatuan. Dimana kesatuan itu dapat menimbulkan makna baru
yang sebelumnya belum ada. Sebaliknya klausa adalah suatu konstruksi yang di
dalamnya terdapat beberapa kata yang mengandung hubungan fungsional, yang
daalam tatabahasa lama dikenal dengan pengertian subyek, predikat, obyek dan
keterangan-keterangan. Sebuah klausa sekurang-kurangnya harus mengandung
satu subyek, satu predikat, dan secara fakultatif satu obyek. Misalnya:
- Saya menyanyikan sebuah lagu.
- Adik membaca buku.
2.3.2.2 Kalimat
Kalimat adalah satuan kumpulan kata yang terkecil dari suatu ujaran atau
teks (wacana) yang mengandung pikiran yang lengkap/utuh secara
ketatabahasaan. Karena itu wacana baru terbentuk jika ada kalimat yang letaknya
berurutan dan berdasarkan kaidah kewacanaan tertentu. Dalam wujud tulisan
berhuruf Latin, kalimat dimulai dengan huruf kapital dan diakhiri dengan tanda
titik (.), tanda tanya (?), dan tanda seru (!) yang sepadan dengan intonasi selesai;
dan sementara itu didalam kalimat terdapat berbagai tanda baca yang berupa
spasi, koma, titik koma, titik dua, dan atau sepasang garis pendek yang mengapit
bentuk tertentu, dimana tanda baca tersebut sepadan dengan jeda.
Apabila dilihat dari segi bentuk sintaksisnya, kalimat terdiri atas bagian-
bagian yang dapat dibedakan berdasarkan statusnya sebagai unsur pembentuk
Page 17
22
yang inti dan yang bukan-inti. Bagian inti adalah bagian kalimat yang tidak dapat
dihilangkan, sedangkan bagian bukan-inti adalah bagian yang dapat dihilangkan.
Kalimat yang terdiri atas satu kesatuan bagian inti, baik dengan maupun tanpa
bagian bukan-inti, disebut dengan kalimat tunggal.
Dalam menentukan kalimat tunggal, pola kalimat mengambil peranan
yang sangat penting. Apabila suatu kalimat hanya mengandung satu kalimat,
sedangkan perluasannya tidak menimbulkan pola yang baru maka kalimat tersebut
disebut kalimat tunggal. Dengan kata lain kalimat tunggal adalah kalimat yang
hanya terdiri dari dua unsur inti dan boleh diperluas dengan satu atau lebih unsur-
unsur tambahan, asal unsur-unsur tambahan tidak boleh membentuk pola yang
baru. Berikut ini adalah contoh kalimat tunggal:
(1) Kami kemarin sore mendatangi pertemuan itu.
(2) Kami mendatangi pertemuan itu.
Kalimat (1) terdiri atas empat bagian, yaitu (i) kami, (ii) kemarin sore, (iii)
mendatangi dan (iv) pertemuan itu. Dari keempat bagian itu, hanya bagian (ii)
yang dapat dihilangkan, sedangkan yang lain tidak. Sehingga kita dapat
mempunyai kalimat (2). Dengan demikian, kemarin sore bukan bagian inti
sedangkan ketiga yang lain bagian inti. Kalimat (1) dan (2) sama-sama merupakan
kalimat tunggal, hanya saja kalimat (1) terdiri atas bagian inti dan bukan-inti
sedangkan kalimat (2) hanya terdiri atas bagian inti.
Selain itu, kalimat dapat pula terdiri atas lebih dari satu bagian inti, baik
dengan maupun tanpa bagian bukan-inti. Dengan kata lain perluasan perluasan
mengakibatkan pembentukan pola kalimat yang baru. Kalimat yang demikian itu
disebut kalimat majemuk. Dilihat dari sudut pembentukannya, kalimat majemuk
dapat dikatakan berasal dari dua kalimat tunggal atau lebih. Selain itu, kalimat-
kalimat tunggal yang diperluas sekian macam hingga unsure-unsur baru itu
membentuk satu atau lebih pola kalimat lagi. Dalam hal itu kalimat tunggal
dipandang sebagai unsur dan disebut klausa. Berikut ini adalah contoh kalimat
majemuk:
Erika sedang belajar dan adiknya sedang menjahit.
Page 18
23
Kalimat majemuk diatas dibentuk dari dua bagian inti, yaitu (i) Erika sedang
belajar, dan (ii) adiknya sedang menjahit. Kedua bagian inti tersebut digabungkan
dengan kata sambung (konjungsi) dan.
Kalimat dapat dibedakan menjadi bermacam-macam kalimat. Hal ini
dikarenakan perbedaan situasi akan menghasilkan tanggapan yang berbeda pula
yang kemudian disalurkan dengan perantaraan bentuk bahasa yang harus
mencerminkan kembali situasi tersebut. Oleh karena itu bentuk-bentuk bahasa,
dalam hal ini kalimat, dapat dibeda-bedakan berdasarkan perbedaan situasi dan
bentuk-bentuk khusus yang digunakan. Berdasarkan macamnya, kalimat tunggal
dapat digolongkan atas:
- Kalimat berita
Kalimat berita adalah kalimat yang mendukung suatu pengungkapan
peristiwa atau kejadian. Ciri-ciri kalimat berita adalah intonasi yang
digunakan adalah intonasi yang netral, tidak ada suatu bagian yang lebih
dipentingkan dari yang lain. Susunan kalimat tidak dapat dijadikan ciri-ciri
karena susunannya hampir sama saja dengan susunan kalimat-kalimat lain.
- Kalimat tanya
Kalimat tanya adalah kalimat yang isinya menanyakan sesuatu atau
seseorang. Pada umumnya kalimat Tanya menghendaki suatu jawaban atas
isi pertanyaan tersebut. Tetapi ada pula pertanyaan yang sama sekali tidak
menghendaki jawaban, pertanyaan semacam ini disebut pertanyaaan retoris.
Biasanya pertanyaan retoris dipakai dalam pidato-pidato atau percakapan-
percakapan lain dimana pendengar sudah mengetahui atau dianggap sudah
mengetahui jawabannya. Ciri-ciri kalimat tanya adalah sebagai berikut:
a. Intonasi yang digunakan adalah intonasi tanya.
b. Sering mempergunakan kata tanya atau dapat pula menggunakan
partikel tanya –kah.
- Kalimat perintah
Kalimat perintah adalah kalimat yang maknanya memberikan perintah untuk
melakukan sesuatu. Ciri-ciri kalimat perintah:
a. Intonasi yang digunakan adalah intonasi keras.
Page 19
24
b. Kata kerja yang mendukung isi kalimat perintah itu biasanya merupakan
kata dasar.
c. Menggunakan partikel pengeras –lah.
Selain macam kalimat diatas, kalimat juga dapat dibedakan menjadi
bermacam-macam dilihat dari segi tinjauannya. Dilihat dari segi pelakunya,
kalimat dapat dibedakan menjadi kalimat aktif dan kalimat tidak aktif. Kalimat
aktif adalah kalimat yang subjeknya menjadi pelaku tindakan yang disebut dalam
atau diterangkan oleh predikat. Sedangkan kalimat pasif adalah kalimat yang
subjeknya menjadi objek dan dikenai tindakan yang disebut pada predikat.
Berikut ini contoh kalimat aktif dan pasif:
(3) Amat menangkap ayam.
(4) Ayam ditangkap oleh Amat.
Dalam kalimat (3), Amat berperan sebagai subjek yang melakukan tindakan yang
diterangkan oleh predikat, yaitu menangkap. Sedangkan pada kalimat (4), Ayam
yang merupakan subyek yang menjadi obyek dari tindakan yang disebut pada
predikat. Source URL: https://pokbongkoh.blogspot.com/2010/01/teori-penunjang-2.html
Visit Godo Bolet for Daily Updated Hairstyles Collection
2.1. Finite State Automaton
Secara umum representasi scanner dinyatakan dengan menyusun suatu
diagram transisi atau transition diagram yang disebut finite automaton.
Finite Automaton memiliki konsep sebagai bentuk yang paling sederhana
dari peralatan komputerisasi abstrak. Meskipun teori finite automaton hanya
berhubungan secara langsung dengan mesin-mesin sederhana, ini merupakan
dasar penting dari banyak aplikasi baik konkrit maupun abstrak. Finite-state
control dari suatu finite automaton juga merupakan inti dari begitu banyak
peralatan komputer yang kompleks, salah satu di antaranya yaitu mesin Turing.
Pengaplikasian finite automata dapat ditemukan pada algoritma-algoritma
yang digunakan untuk pencocokan string pada perangkat lunak editor teks dan
perangkat lunak pengecekan ejaan, serta dapat ditemui juga pada penganalisa
sintaks yang digunakan oleh assemblers atau compilers. Meskipun finite automata
pada umumnya dianggap sebagai peralatan komputer abstrak, ia juga banyak
ditemui pada aplikasi-aplikasi non-komputer, seperti pengatur sinyal lampu lalu-
lintas dan mesin vending.
Automaton memiliki satu alur khusus dan unik untuk setiap kata yang akan
dikenali atau diterima, Jika suatu alur berakhir pada suatu state yang disebut
sebagai final state atau accepting state, maka kata yang ditelusuri tersebut
dikatakan dikenali oleh automaton.
Komponen dasar yang dimiliki oleh Finite Automaton adalah alphabet
yaitu himpunan simbol/lambang yang dikenali. Himpunan alfabet diwakili dengan
∑, jika dan hanya jika ∑ merupakan himpunan simbol yang bersifat tetap dan
bukan merupakan himpunan kosong. Contoh umum dari alphabet di sini adalah
26 (dua puluh enam) huruf yang dikenali dalam bahasa Indonesia ataupun
rangkaian karakter ASCII, yang merupakan rangkaian standar dari kode-kode
komputer. Sedangkan sebuah word, yang disebut juga string atau sentence adalah
rangkaian satu atau lebih alphabet yang telah dinyatakan sebelumnya. Rangkaian
Page 2
7
word itu sendiri disebut bahasa (language), yang diwakili dengan L. Berikut ini
adalah contoh alphabet beserta words yang dapat dibentuknya:
• ∑ = {a, b}, maka contoh words yang dapat dibentuknya yaitu “aab”, “abab”,
“a”, “bbbbbb”, dan lain-lain.
• ∑ = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, maka contoh words yang dapat dibentuknya
yaitu “26498098”, “100103”, “0000”, dan lain-lain.
Lebih lanjut, concatenation adalah proses menggabungkan dua buah word
menjadi satu word baru, yaitu yang terdiri dari rangkaian alphabet dari word
pertama dan disambung dengan rangkaian alphabet dari word ke-dua.
• ∑ = {a, b}, words x = “aaa” dan y = “bbb” dimana setiap a merupakan
anggota himpunan ∑, a∈∑ dan setiap b anggota himpunan ∑, b∈∑. Maka
gabungan atau concatenation x dan y, dinyatakan dengan x.y = “aaabbb”.
Setelah memiliki pemahaman di atas, maka definisi dari sebuah Finite
Automaton dapat ditetapkan sebagai suatu model matematis dari sebuah mesin
yang menerima suatu rangkaian words tertentu yang mengandung alphabet ∑.
Finite Automaton memiliki lima komponen, yaitu antara lain:
a. ∑, merupakan himpunan alphabet input (himpunan simbol/lambang yang
tetap dan bukan merupakan himpunan kosong)
b. S, merupakan himpunan state yang tetap dan bukan merupakan himpunan
kosong.
c. S0, merupakan state awal (start state atau initial state), merupakan anggota
dari S.
d. δ, merupakan fungsi transisi antar state; δ: S x ∑ → S.
e. F, merupakan himpunan state akhir (final state atau accepting state),
merupakan sub-himpunan dari S.
Secara visual, suatu bagan Finite Automaton diwakili dengan suatu graf
berarah dengan rumus G=
δ(s,a) = t}. “V” merupakan himpunan verteks pada graf, “E” merupakan
himpunan sisi pada graf yang pada dasarnya merupakan fungsi-fungsi transisi
antara state yang satu ke state yang lain (state “s” dan “t”, yang masing-
masingnya merupakan anggota dari “S”). Selain itu, setiap sisi graf diberi nama
Page 3
8
dengan alphabet penghubung (alphabet “a”) antara dua verteks yang
dihubungkannya.
Pada umumnya, dalam suatu bagan Finite Automaton terdapat minimal
satu state akhir. Verteks graf yang menunjukkan suatu state, tetapi bukan state
akhir, dinyatakan dengan lingkaran , sedangkan yang menunjukkan suatu
state akhir dinyatakan dengan lingkaran ganda , sisi graf yang menunjukkan
fungsi transisi dinyatakan dengan tanda panah
.
Jadi suatu state dapat menjadi asal dan tujuan dalam suatu fungsi transisi
yang melibatkan dua buah state. Ditinjau dari sudut pandang state asal, maka
setiap state (kecuali state akhir) pasti menjadi state asal dan memiliki fungsi
transisi ke state yang lain, sedangkan state akhir dapat tidak memiliki fungsi
transisi ke state yang lain. Ditinjau dari sudut pandang state tujuan, maka setiap
state (kecuali state awal) pasti menjadi state tujuan.
Finite automaton dibedakan menjadi dua macam, yaitu:
- NFA (Nondeterministic Finite Automaton)
- DFA (Deterministic Finite Automaton)
2.1.1. NFA (Nondeterministic Finite Automaton)
Pada NFA terdapat kemungkinan lebih dari 1 transisi yang keluar dari
sebuah state dengan sumber input yang sama. Berikut ini adalah contoh NFA
Gambar 2.1 Bagan NFA yang menerima aa* | bb* [1]
Page 4
9
Berikut ini adalah tabel transisi NFA:
Tabel 2.1. Tabel Transisi NFA (aa* | bb*)
δ
λ
a
B
0
1,3
-
-
1
-
2
-
2
-
2
-
3
-
-
4
4
-
-
4
Keterangan:
Bagan pada Gambar 2.1. di atas sudah merupakan bagan NFA, karena ada state
asal yang memiliki tujuan ke lebih dari satu state tujuan dengan alphabet
penghubungan yang sama (λ).
Pada gambar diatas state 0 sebagai start state dan state 2 serta state 4
adalah final state. Disini digambarkan NFA menerima suatu input berupa aa* |
bb*. Suatu string “aaa” akan diterima dengan melalui state 0,1,2,2, dan 2. atau
bila NFA menerima string “bbbb” maka akan melalui state 0,3,4,4,4, dan 4. NFA
mempunyai kelebihan dapat melakukan backtracking, namun aksesnya lebih
lambat dibandingkan dengan DFA (Deterministic Finite Automaton).
2.1.2. DFA (Deterministic Finite Automaton)
Pada suatu NFA, suatu state dapat memiliki tujuan ke beberapa state yang
berbeda dengan alphabet penghubung yang sama. Akan tetapi, hal ini tidak
diperbolehkan pada suatu DFA. Untuk menyederhanakan suatu NFA menjadi
suatu DFA dipergunakan Tabel Transisi yang memiliki kolom berupa variasi
alphabet yang diterima dan baris berupa nama-nama state asal. Sedangkan titik
temu antara suatu kolom dan baris diisi dengan nama-nama state tujuan dari state
asal yang tertera pada bagian baris dengan alphabet penghubung yang tertera pada
bagian kolom. Berikut ini adalah contoh suatu DFA yang akan mengenali suatu
bilangan cacah.
Page 5
10
• DFA Bilangan Cacah = <∑, S, S0, F>
∑ = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
S = {S0, S1, S2}
S0 = S0
F = {S1, S2}
Berikut ini adalah bagan DFA untuk Bilangan Cacah:
Gambar 2.2. Bagan DFA Bilangan Cacah [3]
Berikut ini adalah tabel transisi DFA untuk Bilangan Cacah:
Tabel 2.2. Tabel Transisi DFA Bilangan Cacah [3]
δ
0
1..9
S0
S1
S2
S1
-
-
S2
S2
S2
Keterangan:
Bagan pada Gambar 2.2. di atas sudah merupakan bagan DFA yang benar
karena tidak ada state asal yang memiliki tujuan ke lebih dari satu state tujuan
dengan alphabet penghubungan yang sama.
2.2. Parsing Algorithm
Secara umum, analisa struktur secara sintaksis dilakukan pada tahap
parsing. Yang merepresentasikan struktur tersebut adalah Context Free Grammar.
Output dari parser adalah representasi dari parse tree untuk sederetan token yang
Page 6
11
dihasilkan scanner. Parsing algorithm dibedakan menjadi 2 jenis, yaitu Top-
Down parser dan Bottom-Up parser.
2.2.1 Context Free Grammar
Untuk merepresentasikan sintaks bahasa dikenal suatu notasi yang disebut
Context Free Grammar (CFG), dengan adanya CFG maka memungkinkan untuk
membentuk sebuah pohon parser (parse tree). CFG adalah satu dari empat tipe
grammar (tata bahasa) yang ditentukan oleh Noam Chomsky (MIT) pada tahun
1950.
CFG memiliki komponen-komponen sebagai berikut:
a. Terminals.
Terminals adalah simbol dasar yang menjadi pembentuk string –disebut juga
word. Terminal dikenal juga dengan istilah ‘token’.
b. Nonterminals.
Nonterminal adalah variabel sintaksis yang menunjukkan kumpulan string.
Nonterminal memerlukan sekumpulan string yang membantu menentukan
language yang dihasilkan oleh grammar.
c. Start symbol.
Dalam sebuah grammar, salah satu nonterminal berfungsi sebagai start
symbol, dan kumpulan string yang ditunjukkannya adalah language yang
ditentukan oleh grammar.
d. Productions.
Productions pada sebuah grammar berfungsi untuk menentukan cara-cara
dimana terminals dan nonterminals dapat dikombinasikan untuk membentuk
string. Tiap productions terdiri atas sebuah nonterminal, yang diikuti oleh
tanda panah (terkadang simbol ::= digunakan untuk menggantikan tanda
panah), lalu diikuti oleh sebuah string yang terdiri atas nonterminals dan/atau
terminals.
Berikut ini adalah contoh grammar dengan productions untuk ekspresi
aritmetik sederhana:
expr → expr op expr
expr → ( expr )
expr → – expr
Page 7
12
expr → id
op → +
op → –
op → *
op → /
Keterangan:
Pada productions ini, yang termasuk dalam simbol nonterminal adalah expr dan
op, selain itu expr juga berlaku sebagai start symbol. Sedangkan simbol
terminalnya adalah id, +, –, *, /, (, dan )
2.2.2. Top-Down Parser
Top-Down Parser membangun parse tree dengan dimulai dari root
kemudian membangun node-node dari parse tree secara preorder. Salah satu
bentuk umum top-down parser adalah recursive-descent parser, dimana masih
menggunakan backtracking. Bagaimanapun, bactracking parser tidaklah sering
ditemui. Hal ini dikarenakan backtracking jarang diperlukan untuk mem-parse
konstruksi bahasa pemrograman. Kasus khusus recursive-descent parser adalah
predictive parser, dimana predictive parser merupakan salah satu recursive-
descent parser yang tidak menggunakan backtracking.
2.2.2.1. Predictive parser
Untuk membuat sebuah predictive parsers, simbol input sekarang, a dan
nonterminal A haruslah dikembangkan, dimana salah satu alternatif dari produksi
A → α1 | α2 | … | αn adalah alternatif khusus yang menderivasikan sebuah string
yang dimulai dengan a, alternatif yang tepat haruslah diperkirakan dengan
melihat hanya pada simbol pertama yang diderivasikannya. Sebagai contoh, jika
kita memiliki produksi
stmt → if expr then stmt else stmt
| while expr do stmt
| begin stmt end
maka keyword if, while, dan begin memberitahu kita mana alternatif yang hanya
satu yang dapat berhasil jika kita mencari sebuah pernyataan.
Untuk parser, diagram transisi dibuat untuk masing-masing nonterminal.
Label pada ujung diagram transisi adalah token (terminal) dan nonterminal.
Page 8
13
Sebuah transisi pada sebuah token (terminal) berarti kita harus mengambil transisi
tersebut jika token tersebut adalah simbol input berikutnya. Sebuah transisi pada
sebuah nonterminal A dipanggil oleh sebuah prosedur untuk A.
Untuk membuat diagram transisi sebuah predictive parser dari sebuah
grammar, pertama-tama adalah mengurangi rekursi di sebelah kiri dari grammar
dan kemudian faktor sebelah kiri dari grammar. Kemudian untuk tiap nonterminal
A dilakukan hal berikut ini:
a. Buat sebuah initial dan final state.
b. Untuk tiap produksi A → X1 X2 … Xn , buat sebuah garis dari initial ke
final state, dengan garis berlabel X1, X2, …, Xn.
Sebuah program predictive parsing berdasarkan pada sebuah diagram
transisi bertujuan untuk mencocokkan simbol terminal dengan input dan
memanggil sebuah prosedur disaat harus diikuti dengan sebuah garis berlabel
nonterminal. Pendekatan tersebut akan berhasil dengan catatan tidak ada
nondeterminan, dengan kata lain tidak ada lebih dari satu transisi untuk satu input.
Sebagai contoh, kita memiliki grammar berikut ini:
E → T E’
E’ → + T E’
T → F T’
T’ → * F T |
F → ( E ) | id
maka diagram transisi dari grammar diatas adalah sebagai berikut:
Gambar 2.3 Diagram Transisi [1]
Page 9
14
2.2.2.2. Nonrecursive predictive parser
Sebuah predictive parser memiliki sebuah input buffer, sebuah stack,
sebuah parsing table dan sebuah output stream. Input buffer berisi string yang
akan di-parsing, yang diikuti tanda $, simbol yang digunakan sebagai right
endmarker untuk menandakan akhir dari string input. Stack berisi sederet symbol
grammar dengan $ pada bagian paling bawah, yang menunjukkan bagian paling
bawah stack. Mula-mula, stack berisi start symbol dari grammar di atas tanda $.
Parsing table adalah array dua dimensi M[A,a], dimana A adalah nonterminal
dan a adalah terminal atau tanda $.
Konstruksi sebuah predictive parser ditambah dua buah fungsi yang
berkaitan dengan sebuah grammar, G. Fungsi-fungsi tersebut, fungsi First dan
fungsi Follow, memungkinkan kita untuk mengisi isian pada sebuah predictive
parsing table untuk G, kapanpun memungkinkan.
2.2.3. Bottom-Up Parser
Bottom-Up Parser membangun parse tree dimulai dari bawah dan naik
sampai ke root. Langkah-langkah Bottom-Up Parser dapat kita lihat pada contoh
berikut ini, misalnya terdapat grammar berikut ini:
S → aABe
A → aBc | b
B → d
Sentence abbcde dapat menjadi S dengan langkah-langkah berikut ini:
abbcde
aAbcde
aAde
aABe
S
Keterangan:
abbcde kita scan untuk mencari substring yang cocok pada bagian kanan beberapa
production. Setelah menemukannya, kita gantikan dengan substring pada bagian
kiri production yang cocok itu. Langkah tersebut terus diulang sampai sentence
abbcde menjadi S.
Page 10
15
2.3. Tata Bahasa Baku Bahasa Indonesia
Tatabahasa Indonesia terdiri atas tiga unsur, yaitu fonologi, morfologi,
dan sintaksis. Namun, dalam tugas akhir ini hanya akan dibahas mengenai
morfologi dan sintaksis.
2.3.1. Morfologi
Bagian dari tatabahasa yang membahas bentuk kata disebut morfologi.
Didalam morfologi dikenal istilah morfem, dimana morfem adalah kesatuan yang
ikut serta dalam pembentukkan kata dan yang dapat dibedakan artinya. Morfem
sendiri berasal dari kata morphe yang berarti ‘bentuk’, dan akhiran -ema yang
berarti ‘yang mengandung arti’. Dalam bahasa Indonesia kita mendapati dua
macam morfem, yaitu morfem dasar atau morfem bebas seperti kerja, puas bapa,
kayu,dan lain-lain; serta morfem terikat seperti pe-, -an, pe-an, ter-, ber-, me-, dan
lain-lain. Morfem bebas bisa langsung membina sebuah kalimat, sebaliknya
morfem terikat tidak dapat berdiri sendiri, harus diikatkan dengan morfem bebas
terlebih dahulu. Dalam tatabahasa Indonesia, morfem dasar atau morfem bebas
disebut kata dasar, sedangkan morfem terikat disebut imbuhan.
Selain istilah morfem, terdapat istilah alomorf. Alomorf adalah variasi
bentuk dari suatu morfem disebabkan oleh pengaruh lingkungan yang
dimasukinya. Misalnya morfem ber- dalam realisasinya dapat mengambil
bermacam-macam bentuk: ber-, be-, bel-. Dalam morfologi dibicarakan
bagaimana hubungan antara morfem dengan morfem, antara morfem dengan
alomorf, serta bagaimana menggabungkan morfem-morfem itu untuk membentuk
suatu kata.
Seperti yang telah dijelaskan sebelumnya, morfem dibedakan menjadi
dua, yaitu morfem bebas dan morfem terikat. Morfem terikat dalam tatabahasa
Indonesia dapat dibagi lagi atas empat macam berdasarkan tempat terikatnya pada
sebuah morfem dasar, yaitu awalan (prefiks), sisipan (infiks), akhiran (sufiks), dan
konfiks, dimana konfiks adalah gabungan dari dua atau lebih dari ketiga macam
morfem terikat lain yang bersama-sama membentuk suatu kesatuan arti.
Page 11
16
2.3.1.1. Kata
Kata adalah kesatuan-kesatuan terkecil yang diperoleh sesudah sebuah
kalimat dibagi atas bagian-bagiannya, dan mengandung suatu ide. Suatu morfem
bebas sudah merupakan suatu kata, tetapi sebaliknya konsep tentang kata tidak
hanya meliputi morfem bebas melainkan juga semua bentuk gabungan antara
morfem bebas dan morfem terikat, atau morfem dasar dengan morfem dasar. Kata
berdasarkan bentuknya dapat dibagi menjadi:
a. Kata dasar, umumnya terdiri atas dua suku kata, misalnya rumah, lari, nasi dan
sebagainya.
b. Kata berimbuhan, yang dapat dibagi lagi menjadi kata yang berawalan, kata
yang berakhiran, kata yang bersisipan dan kata yang berkonfiks.
c. Kata ulang
d. Kata majemuk
Pembagian jenis kata:
- Kata benda (nomina)
Kata benda adalah nama dari semua benda dan segala yang dibendakan.
Dalam bahasa Indonesia ada nomina yang terdiri atas kata dasar (satu morfem)
yang disebut nomina dasar dan ada yang terdiri atas dua morfem atau lebih
yang disebut nomina turunan. Nomina turunan dibentuk dari nomina dasar
atau kategori kata yang lain, khususnya verba dan adjektiva. Selain itu, ada
pula kata lain seperti numeralia dan konjungsi, tetapi jumlahnya tidak banyak.
Umumnya nomina turunan dibentuk dengan menambahkan prefiks, sufiks
atau konfiks pada bentuk dasar (umumnya bentuk dasar yang diturunkan dari
verba atau verba turunan). Sehingga kita akan memperoleh nomina turunan
seperti pembeli, pembelian dan sebagainya.
- Kata kerja (verba)
Kata kerja adalah semua kata yang menyatakan perbuatan atau laku. Bahasa
Indonesia memiliki dua macam bentuk verba, yakni verba asal, verba yang
dapat berdiri sendiri tanpa afik dalam konteks sintaksis dan verba turunan,
verba yang dibentuk dengan menambahkan afiks pada dasar kata atau
kelompok kata. Apabila suatu kata kerja menghendaki adanya suatu pelengkap
maka disebut kata kerja transitif, misalnya memukul, menangkap, melihat,
Page 12
17
mendapat dan sebagainya. Sebaliknya jika tidak memerlukan suatu pelengkap
maka disebut kata kerja intransitif, misalnya: menangis, meninggal, berjalan,
berdiri dan sebagainya.
- Kata sifat (adjektiva)
Kata sifat adalah kata yang dipakai untuk mengungkapkan sifat atau keadaan
orang, benda, atau binatang.
- Kata keterangan (adverbia)
Kata keterangan adalah kata-kata yang memberi keterangan tentang kata kerja,
kata sifat, kata keterangan, kata bilangan dan seluruh kalimat.
- Kata ganti (pronomina)
Kata ganti adalah segala kata yang digunakan untuk menggantikan kata benda
atau yang dibendakan.
- Kata bilangan (numeralia)
Kata bilangan adalah kata yang menyatakan jumlah benda atau jumlah
kumpulan atau urutan tempat dari nama-nama benda.
- Kata depan (preposisi)
Kata depan adalah kata yang merangkaikan kata-kata atau bagian-bagian
kalimat. Kata depan yang terpenting dalam bahasa Indonesia adalah di, ke,
dari, pada. Selain itu ada beberapa kata depan yang menduduki bermacam-
macam fungsi yang istimewa, antara lain akan, dengan, atas, antara.
- Kata sambung (konjungsi)
Kata sambung adalah kata yang menghubungkan kata-kata, bagian-bagian
kalimat, atau menghubungkan kalimat-kalimat.
2.3.1.2. Imbuhan (Afiks)
Imbuhan terbagi atas:
a. Awalan (Prefiks).
Awalan adalah suatu unsur struktural yang diikatkan di depan sebuah kata
dasar atau bentuk dasar. Yang dimaksud disini adalah hubungan antar awalan dan
kata dasar adalah hubungan struktural, yaitu bahwa semua unsur (awalan dan
kata dasar) merupakan bagian dari kata turunan (kata yang berawalan).
Page 13
18
Yang termasuk di dalam awalan adalah ber-, me-, pe-, per-, di-, ke-, ter-
dan se-. Didalam menambahkan awalan pada suatu bentuk dasar, ada suatu proses
yang terkadang ikut andil didalamnya, proses yang dimaksud adalah proses
nasalisasi. Proses nasalisasi inilah yang akan menyebabkan bervariasinya bentuk
awalan, bentuk-bentuk variasi itu disebut dengan Alomorf.
Untuk awalan ber- terdapat tiga macam bentuk yaitu be-, ber-, dan bel-.
Awalan me- dan pe- memiliki bentuk yang lebih banyak lagi karena mengalami
proses nasalisasi. Bentuk awalan me- antara lain me-, mem-, men-, meng-, meny-,
dan menge- sedangkan bentuk awalan per- antara lain pe-, per-, pem-, pen-, peng-,
peny-, dan penge-. Sedangkan untuk bentuk awalan lainnya tidak mengalami
perubahan bentuk setelah ditambahkan pada kata dasar.
b. Sisipan (Infiks).
Sisipan adalah semacam morfem terikat yang disisipkan pada sebuah kata
antara konsonan pertama dengan vokal pertama. Jenis morfem ini pemakaiannya
terbatas pada beberapa kata saja. Sisipan yang terdapat dalam bahasa Indonesia
adalah -el-, -er-, dan -em-.
c. Akhiran (Sufiks).
Akhiran adalah semacam morfem terikat yang dilekatkan di belakang
suatu morfem dasar. Macam-macam akhiran yang terdapat dalam bahasa
Indonesia adalah akhiran -an, -kan, -i.
d. Konfiks.
Konfiks adalah gabungan prefiks dan sufiks yang mengapit kata dasar dan
membentuk satu kesatuan, awalan dan akhiran dilekatkan secara serentak pada
kata dasar, selain itu pemenggalan salah satu afiks tidak akan meninggalkan
bentuk yang masih berwujud kata yang maknanya masih dapat ditelusuri. Yang
termasuk konfiks adalah ke-an dan per-an.
e. Gabungan imbuhan.
Gabungan imbuhan adalah pemakaian beberapa imbuhan sekaligus pada
suatu kata dasar, yang masing-masing mempertahankan arti dan fungsinya.
Imbuhan-imbuhan yang biasa dipakai bersama-sama adalah me-kan, di-kan, mem-
per-kan, di-per-kan, mem-per-i, di-per-i, ber-kan, dan ber-an.
Page 14
19
Bentuk-bentuk alomorf dari imbuhan-imbuhan diatas dapat kita lihat pada
tabel berikut ini:
Tabel 2.3. Tabel Bentuk Alomorf dari Imbuhan
Imbuhan
Alomorf
be-
bel-
1. be-
ber-
me-
mem-
men-
meng-
menge-
2. meN-
meny-
pe-
3. peN-
pem-
pen-
peng-
penge-
peny-
per-
te-
tel-
4. ter-
ter-
Keterangan:
Pada tabel diatas morfem pe- dan me- selain mempunyai bentuk alomorf sendiri
juga mengalami nasalisasi yang menyebabkan bentuk alomorf-nya bertambah.
Data tabel diperoleh dari referensi Tata Bahasa Indonesia halaman 94-106.
2.3.1.3. Nasalisasi
Nasalisasi adalah proses merubah atau memberi nasal pada fonem-fonem.
Dalam menasalkan suatu fonem haruslah mengikuti kaidah-kaidah tertentu. Tiap
fonem yang dinasalkan harus mengambil nasal yang homorgan, maksudnya nasal
yang mempunyai articulator dan titik artikulasi yang sama dengan fonem yang
dinasalkan itu. Misalnya p dan b harus mengambil nasal m (karena sama-sama
bilabial), t dan d harus mengambil nasal n (karena sama-sama dental), k dan g
harus mengambil nasal ng (karena sama-sama velar) dan sebagainya. Nasalisasi
hanya berlangsung pada kata-kata dasar, atau yang dianggap kata dasar.
Page 15
20
Dalam proses nasalisasi terdapat konsonan yang mengalami peluluhan dan
ada juga yang tidak setelah mengalami nasalisasi. Hal ini terjadi dikarenakan
adanya konsonan bersuara dan konsonan tidak bersuara, konsonan yang bersuara
tidak akan mengalami peluluhan setelah proses nasalisasi karena bersifat sama
dengan konsonan nasal (bersuara), sebaliknya konsonan tidak bersuara harus
disesuaikan dengan fonem nasal yang bersuara. Yang termasuk fonem-fonem
bersuara adalah b, d, g, dan j. Sedangkan fonem yang tidak bersuara adalah p, t, k,
dan s. Selain itu Fonem-fonem y, r, l, dan w dianggap mengalami proses
nasalisasi juga, tetapi nasalisasi yang zero (tidak ada). Sedangkan kata-kata yang
dimulai dengan vokal atau fonem /h/ akan mengambil nasal ng. Keseluruhannya
dapat kita lihat pada tabel berikut ini:
Tabel 2.4. Tabel Nasalisasi
Fonem awal
Nasalisasi
Keterangan
1. /b/,/f/,/p/
m
fonem /p/ dapat mengalami
peluluhan
2. /c/,/d/,/j/,/t/
n
fonem /t/ dapat mengalami
peluluhan
3. /a/,/e/,/g/,/h/,/i/,/k/,/o/,/u/
ng
fonem /k/ dapat mengalami
peluluhan
4. /s/
ny
fonem /s/ dapat
mengalami peluluhan
5. /m/,/n/,/ng//ny/,/l/,/r/,/y/,/w/ tidak ada
Keterangan:
Data tabel diperoleh dari referensi Tata Bahasa Indonesia halaman55-57.
Pada prinsipnya, proses peluluhan hanya berlaku pada kata-kata dasar,
bukan pada afiks. Demikian juga kata-kata asing yang terasa masih asing, tetap
mempertahankan konsonan-konsonan tak bersuara untuk menjaga jangan sampai
menimbulkan salah paham. Misalnya saja kata-kata asing sabot, koordinir yang
tetap mempertahankan fonem awalnya walaupun fonem itu tidak bersuara.
Sedangkan untuk kata yang fonem awalnya /p/, dimana fonem tersebut
merupakan fonem awal dari penambahan imbuhan (per) maka fonem /p/ juga
tidak luluh meskipun fonem /p/ merupakan fonem tidak bersuara.
Page 16
21
2.3.2. Sintaksis
Sintaksis adalah bagian dari tatabahasa yang memperlajari dasar-dasar dan
proses-proses pembentukan kalimat dalam suatu bahasa. Setiap bahasa memiliki
sistem khusus untuk mengikat kata atau kelompok kata ke dalam suatu gerak yang
dinamis. Sintaksis bahasa haruslah merupakan perumusan dari berbagai macam
gejala susun-peluk kata-kata dalam suatu bahasa. Sebab itu tidak dibenarkan
menerapkan sintaksis suatu bahasa pada bahasa lain. Berdasarkan strukturnya,
frasa dan klausa serta kalimat termasuk dalam sintaksis.
2.3.2.1. Frasa dan Klausa
Frasa adalah suatu konstruksi yang terdiri dari dua kata atau lebih yang
membentuk suatu kesatuan. Dimana kesatuan itu dapat menimbulkan makna baru
yang sebelumnya belum ada. Sebaliknya klausa adalah suatu konstruksi yang di
dalamnya terdapat beberapa kata yang mengandung hubungan fungsional, yang
daalam tatabahasa lama dikenal dengan pengertian subyek, predikat, obyek dan
keterangan-keterangan. Sebuah klausa sekurang-kurangnya harus mengandung
satu subyek, satu predikat, dan secara fakultatif satu obyek. Misalnya:
- Saya menyanyikan sebuah lagu.
- Adik membaca buku.
2.3.2.2 Kalimat
Kalimat adalah satuan kumpulan kata yang terkecil dari suatu ujaran atau
teks (wacana) yang mengandung pikiran yang lengkap/utuh secara
ketatabahasaan. Karena itu wacana baru terbentuk jika ada kalimat yang letaknya
berurutan dan berdasarkan kaidah kewacanaan tertentu. Dalam wujud tulisan
berhuruf Latin, kalimat dimulai dengan huruf kapital dan diakhiri dengan tanda
titik (.), tanda tanya (?), dan tanda seru (!) yang sepadan dengan intonasi selesai;
dan sementara itu didalam kalimat terdapat berbagai tanda baca yang berupa
spasi, koma, titik koma, titik dua, dan atau sepasang garis pendek yang mengapit
bentuk tertentu, dimana tanda baca tersebut sepadan dengan jeda.
Apabila dilihat dari segi bentuk sintaksisnya, kalimat terdiri atas bagian-
bagian yang dapat dibedakan berdasarkan statusnya sebagai unsur pembentuk
Page 17
22
yang inti dan yang bukan-inti. Bagian inti adalah bagian kalimat yang tidak dapat
dihilangkan, sedangkan bagian bukan-inti adalah bagian yang dapat dihilangkan.
Kalimat yang terdiri atas satu kesatuan bagian inti, baik dengan maupun tanpa
bagian bukan-inti, disebut dengan kalimat tunggal.
Dalam menentukan kalimat tunggal, pola kalimat mengambil peranan
yang sangat penting. Apabila suatu kalimat hanya mengandung satu kalimat,
sedangkan perluasannya tidak menimbulkan pola yang baru maka kalimat tersebut
disebut kalimat tunggal. Dengan kata lain kalimat tunggal adalah kalimat yang
hanya terdiri dari dua unsur inti dan boleh diperluas dengan satu atau lebih unsur-
unsur tambahan, asal unsur-unsur tambahan tidak boleh membentuk pola yang
baru. Berikut ini adalah contoh kalimat tunggal:
(1) Kami kemarin sore mendatangi pertemuan itu.
(2) Kami mendatangi pertemuan itu.
Kalimat (1) terdiri atas empat bagian, yaitu (i) kami, (ii) kemarin sore, (iii)
mendatangi dan (iv) pertemuan itu. Dari keempat bagian itu, hanya bagian (ii)
yang dapat dihilangkan, sedangkan yang lain tidak. Sehingga kita dapat
mempunyai kalimat (2). Dengan demikian, kemarin sore bukan bagian inti
sedangkan ketiga yang lain bagian inti. Kalimat (1) dan (2) sama-sama merupakan
kalimat tunggal, hanya saja kalimat (1) terdiri atas bagian inti dan bukan-inti
sedangkan kalimat (2) hanya terdiri atas bagian inti.
Selain itu, kalimat dapat pula terdiri atas lebih dari satu bagian inti, baik
dengan maupun tanpa bagian bukan-inti. Dengan kata lain perluasan perluasan
mengakibatkan pembentukan pola kalimat yang baru. Kalimat yang demikian itu
disebut kalimat majemuk. Dilihat dari sudut pembentukannya, kalimat majemuk
dapat dikatakan berasal dari dua kalimat tunggal atau lebih. Selain itu, kalimat-
kalimat tunggal yang diperluas sekian macam hingga unsure-unsur baru itu
membentuk satu atau lebih pola kalimat lagi. Dalam hal itu kalimat tunggal
dipandang sebagai unsur dan disebut klausa. Berikut ini adalah contoh kalimat
majemuk:
Erika sedang belajar dan adiknya sedang menjahit.
Page 18
23
Kalimat majemuk diatas dibentuk dari dua bagian inti, yaitu (i) Erika sedang
belajar, dan (ii) adiknya sedang menjahit. Kedua bagian inti tersebut digabungkan
dengan kata sambung (konjungsi) dan.
Kalimat dapat dibedakan menjadi bermacam-macam kalimat. Hal ini
dikarenakan perbedaan situasi akan menghasilkan tanggapan yang berbeda pula
yang kemudian disalurkan dengan perantaraan bentuk bahasa yang harus
mencerminkan kembali situasi tersebut. Oleh karena itu bentuk-bentuk bahasa,
dalam hal ini kalimat, dapat dibeda-bedakan berdasarkan perbedaan situasi dan
bentuk-bentuk khusus yang digunakan. Berdasarkan macamnya, kalimat tunggal
dapat digolongkan atas:
- Kalimat berita
Kalimat berita adalah kalimat yang mendukung suatu pengungkapan
peristiwa atau kejadian. Ciri-ciri kalimat berita adalah intonasi yang
digunakan adalah intonasi yang netral, tidak ada suatu bagian yang lebih
dipentingkan dari yang lain. Susunan kalimat tidak dapat dijadikan ciri-ciri
karena susunannya hampir sama saja dengan susunan kalimat-kalimat lain.
- Kalimat tanya
Kalimat tanya adalah kalimat yang isinya menanyakan sesuatu atau
seseorang. Pada umumnya kalimat Tanya menghendaki suatu jawaban atas
isi pertanyaan tersebut. Tetapi ada pula pertanyaan yang sama sekali tidak
menghendaki jawaban, pertanyaan semacam ini disebut pertanyaaan retoris.
Biasanya pertanyaan retoris dipakai dalam pidato-pidato atau percakapan-
percakapan lain dimana pendengar sudah mengetahui atau dianggap sudah
mengetahui jawabannya. Ciri-ciri kalimat tanya adalah sebagai berikut:
a. Intonasi yang digunakan adalah intonasi tanya.
b. Sering mempergunakan kata tanya atau dapat pula menggunakan
partikel tanya –kah.
- Kalimat perintah
Kalimat perintah adalah kalimat yang maknanya memberikan perintah untuk
melakukan sesuatu. Ciri-ciri kalimat perintah:
a. Intonasi yang digunakan adalah intonasi keras.
Page 19
24
b. Kata kerja yang mendukung isi kalimat perintah itu biasanya merupakan
kata dasar.
c. Menggunakan partikel pengeras –lah.
Selain macam kalimat diatas, kalimat juga dapat dibedakan menjadi
bermacam-macam dilihat dari segi tinjauannya. Dilihat dari segi pelakunya,
kalimat dapat dibedakan menjadi kalimat aktif dan kalimat tidak aktif. Kalimat
aktif adalah kalimat yang subjeknya menjadi pelaku tindakan yang disebut dalam
atau diterangkan oleh predikat. Sedangkan kalimat pasif adalah kalimat yang
subjeknya menjadi objek dan dikenai tindakan yang disebut pada predikat.
Berikut ini contoh kalimat aktif dan pasif:
(3) Amat menangkap ayam.
(4) Ayam ditangkap oleh Amat.
Dalam kalimat (3), Amat berperan sebagai subjek yang melakukan tindakan yang
diterangkan oleh predikat, yaitu menangkap. Sedangkan pada kalimat (4), Ayam
yang merupakan subyek yang menjadi obyek dari tindakan yang disebut pada
predikat.
Visit Godo Bolet for Daily Updated Hairstyles Collection
0 comments:
Post a Comment