<p class="Default"><em>Abstrak</em> – <strong>T</strong><strong>elah dilakukan penelitian tentang </strong><strong>pengolahan terdistribusi data genbank menggunakan <em>Hadoop Distributed Filesystem </em>(HDFS) dengan tujuan mengetahui efektifitas pengolahan data genbank khususnya pada pencarian sequens dengan data masukan yang berukuran besar.</strong><strong> Penelitian dilakukan di </strong><strong>L</strong><strong>aboratorium </strong><strong>Jaringan Universitas Al Azhar Indonesia dengan menggunakan 6 komputer dan satu <em>server</em> dimana dalam <em>Hadoop</em> menjadi 7 <em>node</em> dengan rincian 1 <em>namenode</em>, 7 <em>datanode</em>, 1 secondary <em>namenode</em>. Dengan eksperimen HDFS menggunakan 1 <em>node</em>, 2 <em>node</em>, 4 <em>node</em>, 6 <em>node</em>, dan 7 <em>node</em> dibandingkan dengan <em>Local Filesystem</em>. Hasil menunjukan proses pencarian sequens data genbank menggunakan 1 – 7 <em>node</em> pada skenario eksperimen pertama dengan <em>output</em> yang menampilkan hasil 3 <em>field</em> <em>(Locus, Definition, </em>dan<em> Authors</em>), skenario eksperimen kedua dengan <em>output</em> yang menampilkan hasil 3 <em>field</em> <em>(Locus, Authors, </em>dan<em> Origin)</em>, dan skenario eksperimen ketiga menggunakan HDFS dan LFS dengan <em>output</em> yang menampilkan seluruh <em>field</em> yang terdapat dalam data genbank (</strong><strong><em>Locus, Definition, Accesion, Version, Keywords, Source, Organism, Reference, Authors, Title, Journal, Pubmed, Comment, Features, </em></strong><strong>dan<em> Origin</em></strong><strong>). Evaluasi menunjukan bahwa proses pencarian sequens data genbank menggunakan HDFS dengan 7 <em>node</em> adalah 4 kali lebih cepat dibandingkan dengan menggunakan 1 <em>node</em>. Sedangkan perbedaan waktu pada penggunaan HDFS dengan 1 <em>node</em> adalah 1.02 kali lebih cepat dibandingkan dengan <em>Local Filesystem</em> dengan 4 <em>core</em> <em>processor</em>.</strong></p><p class="Default"><strong> </strong></p><p><em>Abstract </em><strong>- A research on distributed processing of GenBank data using Hadoop Distributed File System GenBank (HDFS) in order to know the effectiveness of data processing, especially in the search sequences with large input data. Research conducted at the Network Laboratory of the University of Al Azhar Indonesia using 6 computers and a server where the Hadoop to 7 nodes with details 1 namenode, 7 datanode, 1 secondary namenode. With HDFS experiments using 1 node, node 2, node 4, node 6, and 7 nodes compared with the Local Filesystem. The results show the search process of data GenBank sequences using 1-7 nodes in the first experiment scenario with an output that displays the results of 3 fields (Locus, Definition, and Authors), a second experiment scenario with an output that displays the results of 3 fields (Locus, Authors, and Origin) , and the third experiment scenarios using HDFS and LFS with output that displays all the data fields contained in GenBank (Locus, Definition, Accesion, Version, Keywords, Source, Organism, Reference, Authors, Title, Journal, Pubmed, Comment, Features, and Origin). Evaluation shows that the search process of data GenBank sequences using HDFS with 7 nodes is 4 times faster than using one node. While the time difference in the use of HDFS with one node is 1:02 times faster than the Local File System with 4 core processor.</strong></p><p><strong><em> </em></strong></p><p><strong><em></em></strong><strong><em>Keywords </em></strong><em>– genbank, sequens, distributed computing, Hadoop, HDFS</em></p>