Simple Base-alignment Program

[ Bioinformatics ]
º¹ÀâÇÑ »ý¸í Çö»óÀ» ºÐ¼®Çϱâ À§ÇØ Àü»êÇÐ ±â¼úÀ» µµÀÔ, ÃÖ±Ù °¢±¤¹Þ°í ÀÖ´Â ºñ±³Àû »õ·Î¿î Çй® ºÐ¾ßÀÌ´Ù.
Bio ¿Í CS ¸ðµÎ¿¡ ´ëÇÑ »ó´çÈ÷ ±íÀº Áö½ÄÀÌ ÇÊ¿äÇÏ´Ù´Â Á¡¿¡¼­ ÇöÀç·Î¼± ½±°Ô Á¢±ÙÇϱ⠾î·Á¿î ºÐ¾ßÀÏ ¼öµµ ÀÖ°Ú´Ù.

[ Simple Base-alignment Program ]
À̹ø¿¡ ¼±º¸ÀÏ ÇÁ·Î±×·¥Àº ÀÌ Áß ¾ÆÁÖ ±âÃÊ Áß¿¡¼­µµ ±âÃÊÀÎ ¼­¿­ Á¤·Ä ÇÁ·Î±×·¥ÀÌ´Ù.
µ¿Àû ¾Ë°í¸®ÁòÀ» ÅëÇØ µÎ ¼­¿­ÀÇ Global/Local Á¤·ÄÀ» ¼öÇàÇϰí Á¡¼ö¸¦ °è»êÇØÁØ´Ù.

ÀÌ¹Ì È¿°úÀûÀÎ ´ÙÁß ¼­¿­ Á¤·Ä ÇÁ·Î±×·¥µéµµ ³ª¿ÍÀÖ´Â ½ÃÁ¡¿¡¼­ À¯¿ë¼ºÀº ÀüÇô ¾ø´Â °ÍÀÌÁö¸¸ ¾Ë°í¸®Áòµµ °£´ÜÇϰí ÇÏ¿© ½Ã°£À» Âɰ³ Çѹø ¸¸µé¾î º¸¾Ò´Ù.

Àü¿ª Á¤·ÄÀ̶õ ÁÖ¾îÁø ¼­¿­ Àüü¿¡ ´ëÇØ ¾ó¸¶³ª À¯»çÇѰ¡¸¦ Æò°¡ÇÏ´Â °ÍÀ̰í, Áö¿ª Á¤·ÄÀ̶õ ÁÖ¾îÁø ¼­¿­¿¡¼­ °¡Àå À¯»çµµ°¡ ³ôÀº ºÎºÐÀ» ã¾Æ³»´Â °ÍÀÌ´Ù.

Global Á¤·Ä¿¡´Â Needleman-Wunsch ¾Ë°í¸®ÁòÀ»
Local Á¤·Ä¿¡´Â Smith-Waterman ¾Ë°í¸®ÁòÀ» »ç¿ëÇÏ¿´´Ù.

DNA ¿°±â(base)¸¦ ÀÌ¿ëÇÑ °£·«ÇÑ È°¿ë ¿¹¸¦ µéÀÚ¸é ´ÙÀ½°ú °°´Ù.
ÀÔ·Â:  seq1: AATACAG
       seq2: ATGCA
       match: 5, mismatch: -4, gap: -7
Ãâ·Â:  AATACAG
        || || 
        ATGCA 

        match: 4   mismatch: 1   gap: 2
        total score: 2
µÎ ¼­¿­ÀÇ À¯»çµµ Á¡¼ö´Â 2Á¡À̸ç ÀÌ ¶§ÀÇ Á¤·Ä ÇüÅ´ Ãâ·Â °á°ú¿Í °°´Ù. Ãâ·Â °á°ú¿¡¼­ ÁÙ·Î ¿¬°áµÈ °æ¿ì°¡ match, Áß¾ÓÀÇ 'A'¿Í 'G'ÀÇ °æ¿ì°¡ mismatch, ¸¶Áö¸·À¸·Î ÇÑ Âʸ¸ ¿°±â°¡ À§Ä¡ÇÑ ¾ç ³¡ÀÌ gap¿¡ ÇØ´çÇÑ´Ù.

½ÇÇà: java -jar align.jar
(1.4 ÄÄÆÄÀÏ·¯·Î ÄÄÆÄÀÏÇÏ¿´À½)

¾Æ·¡´Â °úÁ¦·Î ³ª¿Â ¿¹¸¦ ¼öÇàÇØº» °ÍÀÌ´Ù.


´ÙÀ½Àº À§ ¿¹Á¦ÀÇ Working Matrix.


¹öÀüÀÌ 1.1·Î ¿Ã¶ó°¡¸é¼­ Valid Characters¸¦ Á÷Á¢ ÀÔ·ÂÇÒ ¼ö ÀÖµµ·Ï ¼öÁ¤µÇ¾ú°í(±âÁ¸¿£ ¿£Áø Â÷¿ø¿¡¼­¸¸ Áö¿øµÇ¾úÀ½), Base (DNA), Base(RNA), Amino Acid¿¡ ´ëÇÑ Valid Characters¸¦ ÅøÀÌ ÀÚµ¿À¸·Î ä¿ö³Ö¾îÁÙ ¼ö ÀÖµµ·Ï ÇÏ¿´´Ù.
¶ÇÇÑ case sensitiveÇÑ Á¤·ÄÀ» ¼öÇàÇÒ °ÍÀÎÁö ¼±ÅÃÇÒ ¼ö ÀÖ´Â ±â´ÉÀÌ Ãß°¡µÇ¾ú´Ù.