µ¥ÀÌÅÍ Á᫐ Á¶Á÷ÀÇ µ¿¹ÝÀÚ, µ¥ÀÌÅÍ Àü¹® ±â¾÷ ¼ÒÇÁÆ®¶óÀÎ

µ¥ÀÌÅÍ »çÀ̾ð½º? µ¥ÀÌÅÍ ºÐ¼®?

µ¥ÀÌÅÍ¿¡ ´ëÇÑ °ü½ÉÀÌ ³ô¾ÆÁö¸é¼­ µ¥ÀÌÅͷκÎÅÍ °¡Ä¡¸¦ âÃâÇÏ´Â ÇàÀ§¸¦ ÁöĪÇÏ´Â ¿ë¾îµµ ´Ù¾çÇØÁ³½À´Ï´Ù. ±×»Ó¸¸ÀÌ ¾Æ´Ï¶ó ´Ù¾çÇÑ ¿ë¾îµéÀÇ °³³äµµ ¼­·Î ºÐ¸íÈ÷ ±¸ºÐµÇÁö ¾Ê¾Æ È¥¶õÀ» °¡Áß½ÃÅ°°í ÀÖ½À´Ï´Ù. ´ëÇ¥ÀûÀÎ ¿ë¾îµéÀÌ ¹Ù·Î µ¥ÀÌÅÍ »çÀ̾𽺠(Data science) ¿Í µ¥ÀÌÅÍ ºÐ¼® (Data analysis) ÀÔ´Ï´Ù. ÀÌ ¿ë¾îµéÀÌ È¥µ¿À» ÃÊ·¡ÇÏ´Â °¡Àå Å« ÀÌÀ¯´Â ±× Â÷ÀÌ°¡ ¸Å¿ì ¹Ì¹¦Çϰųª ¶§·Î´Â ¾Æ¿¹ Â÷ÀÌ°¡ ¾ø¾îÁö±âµµ Çϱ⠶§¹®ÀÔ´Ï´Ù. °Ô´Ù°¡ ¾÷°è Àü¹Ý¿¡ Åë¿ëµÇ´Â °øÀÎµÈ »çÀüÀûÀÎ Á¤Àǵµ ¾ø´Â »óȲÀ̶ó °üÁ¡¿¡ µû¶ó Çؼ®ÀÌ Å©°Ô ´Þ¶óÁö±âµµ ÇÕ´Ï´Ù. µû¶ó¼­, »ç½Ç»ó À¯ÀÏÇÑ ´ë¾ÈÀº °¢ÀÚ°¡ ¿¬±¸¸¦ ÅëÇØ ÀڽŸ¸ÀÇ ÀÌÇظ¦ °¡Áö´Â °Í»ÓÀÔ´Ï´Ù.

ÀÌ·± ¸Æ¶ô¿¡¼­ ¼ÒÇÁÆ®¶óÀÎÀÌ ÀÌÇØÇÏ´Â µÎ ¿ë¾îÀÇ °³³äÀº ´ÙÀ½°ú °°½À´Ï´Ù.
1. µ¥ÀÌÅÍ »çÀ̾𽺠(Data science) : ¹®Á¦¸¦ Á¤ÀÇÇÏ°í, ÇØ°áÀ» À§ÇØ °¡¼³À» ¼¼¿ì°í, µ¥ÀÌÅͷκÎÅÍ ÀϹÝÈ­µÈ ÆÐÅÏÀ» µµÃâÇØ °¡¼³À» ÀÔÁõÇÏ¿© ¼Ö·ç¼ÇÀ» Á¦°øÇÏ°í ¾÷¹«¿¡ Àû¿ëÇÏ´Â È°µ¿.
2. µ¥ÀÌÅÍ ºÐ¼® (Data analysis) : µ¥ÀÌÅÍ »çÀ̾𽺺¸´Ù ÇùÀÇÀÇ °³³äÀ¸·Î µ¥ÀÌÅͷκÎÅÍ ÀλçÀÌÆ®¸¦ ÇнÀÇÏ´Â È°µ¿¸¸À» ÁöĪÇÔ.

µ¥ÀÌÅÍ ºÐ¼®ÀÇ Á¾·ù

µ¥ÀÌÅÍ »çÀ̾ð½ºÀÇ ÇÙ½ÉÀûÀÎ ¿ä¼Ò Áß ÇϳªÀÎ µ¥ÀÌÅÍ ºÐ¼®ÀÇ Á¾·ù´Â ´Ù¾çÇÕ´Ï´Ù. Å©°Ô ºÐ¼® ´ë»óÀÌ µÇ´Â µ¥ÀÌÅÍ¿¡ µû¸¥ ºÐ·ù, ºÐ¼®ÀÇ ¸ñÀû¿¡ µû¸¥ ºÐ·ù°¡ ÀÖÀ» ¼ö Àִµ¥, ÀüÀÚÀÇ °æ¿ì´Â Geospatial, Time-series, Graph, Text, Image µî µ¥ÀÌÅÍ ºÐ¼®ÀÇ °³³äÀû ºÐ·ù¶ó±âº¸´Ù µ¥ÀÌÅÍ Æ¯¼º¿¡ µû¸¥ ±â¼úÀû ºÐ·ùÀÔ´Ï´Ù. µû¶ó¼­ µ¥ÀÌÅÍ ºÐ¼®À» ÀÌÇØÇÏ´Â µ¥¿¡´Â ÈÄÀÚÀÇ ºÐ·ù°¡ ´õ ÀûÇÕÇÏ´Ù°í ÇÒ ¼ö ÀÖ½À´Ï´Ù.

ºÐ¼®ÀÇ ¸ñÀû¿¡ µû¸¥ ºÐ·ù ¿ª½Ã ¿©·¯ °¡Áö Çؼ®ÀÌ ÀÖÁö¸¸ °¡Àå ü°èÀûÀÎ ºÐ·ù´Â Á¸½º ȩŲ½º ´ëÇÐÀÇ Jeff LeekÀÌ Á¦½ÃÇÑ 6°¡Áö ºÐ·ùÀÔ´Ï´Ù.
1. ±â¼úÀû ºÐ¼® (Descriptive) : ÁÖ¾îÁø µ¥ÀÌÅÍ¿¡ ´ëÇÑ ¼³¸íÀ» ¸ñÀûÀ¸·Î ÇÏ´Â ºÐ¼®. Æò±Õ, ºÐ»ê, Ç¥ÁØÆíÂ÷ µî º¸ÆíÀûÀÎ ÁöÇ¥µéÀ» È°¿ëÇØ µ¥ÀÌÅÍ ÀÚüÀÇ Æ¯¼ºÀ» Çؼ³ÇÏ´Â °ÍÀÌ ¸ñÀû.
2. Ž»öÀû ºÐ¼® (Exploratory) : ÁÖ¾îÁø µ¥ÀÌÅ͸¦ ´Ù¾çÇÑ ¹æ½ÄÀ¸·Î »ìÆì µ¥ÀÌÅÍ ³» º¯¼öµé °£ÀÇ »ó°ü°ü°è, Æ®·»µå µîÀ» Ž»ö.
3. Ãß·ÐÀû ºÐ¼® (Inferential) : Ž»öÀû ºÐ¼®¿¡¼­ ¹ß°ßÇÑ ÁÖ¾îÁø »ùÇà µ¥ÀÌÅÍ ³»¿¡ Á¸ÀçÇÏ´Â »ó°ü°ü°è°¡ »ùÇøµµÇÁö ¾ÊÀº ³ª¸ÓÁö °æ¿ì¿¡µµ Àû¿ë °¡´ÉÇÑÁö ¿©ºÎ¸¦ Åë°èÀûÀ¸·Î Ãß·Ð.
4. ¿¹Ãø ºÐ¼® (Predictive) : ÁÖ¾îÁø »ùÇà µ¥ÀÌÅͷκÎÅÍ Àüü µ¥ÀÌÅÍ·Î ÀϹÝÈ­ÇÒ ¼ö ÀÖ´Â ÆÐÅÏÀ» µµÃâÇØ ¸ðµ¨À» ¸¸µé¾î ÀÏ·ÃÀÇ º¯¼ö °ªÀ¸·ÎºÎÅÍ Æ¯Á¤ÇÑ º¯¼öÀÇ °ªÀ» ¿¹Ãø.
5. Àΰú°ü°è ºÐ¼® (Causal) : º¯¼öµé °£ÀÇ »ó°ü°ü°è¿¡ Á¤·®Àû Àΰú°ü°è°¡ Á¸ÀçÇÏ´ÂÁö¸¦ ºÐ¼®.
6. È®Á¤°ü°è ºÐ¼® (Mechanistic) : Àΰú°ü°è°¡ ¿¹¿Ü¾øÀÌ Àû¿ëÇÒ ¼ö ÀÖ´Â ¹ýÄ¢ÀÎÁö È®ÀÎ.

ÀÌó·³ µ¥ÀÌÅͷκÎÅÍ ÀλçÀÌÆ®¸¦ µµÃâÇÏ´Â È°µ¿Àº ´Ù¾çÇÕ´Ï´Ù. ÀϹÝÀûÀ¸·Î µ¥ÀÌÅÍ ºÐ¼®À» ÇÑ´Ù´Â ¸»Àº ¼ø¼ö°úÇÐÀÇ ¿µ¿ª¿¡ ¼ÓÇÏ´Â È®Á¤°ü°è ºÐ¼®À» Á¦¿ÜÇÑ ³ª¸ÓÁö ºÐ¼®¹æ½ÄÀ» ¼öÇàÇÑ´Ù´Â ÀǹÌÀÔ´Ï´Ù. ÁÖÀÇÇÒ Á¡Àº 1¹øºÎÅÍ 6¹ø±îÁöÀÇ ºÐ·ù°¡ »óÈ£ ¹èŸÀûÀÎ ±¸ºÐÀÌ ¾Æ´Ï¶ó Á¡ÁøÀûÀÎ °íµµÈ­ ´Ü°è¶ó´Â Á¡ÀÔ´Ï´Ù. Áï, ±â¼úÀû ºÐ¼®¾øÀÌ Å½»öÀû ºÐ¼®ÀÌ ºÒ°¡´ÉÇÏ°í, Ž»öÀû ºÐ¼®¾øÀÌ ¿¹ÃøºÐ¼®À» ÇÒ ¼ö´Â ¾ø´Ù´Â ÀǹÌÀÔ´Ï´Ù. ¸¸¾à ¿¹ÃøºÐ¼®À» ¼öÇàÇÏ°íÀÚ ÇÑ´Ù¸é ±â¼úÀû ºÐ¼®ºÎÅÍ Ãß·ÐÀû ºÐ¼®À» ÁøÇàÇÒ ÇÊ¿ä°¡ ÀÖ½À´Ï´Ù.

´õ ³ôÀº ¼öÁØÀÇ µ¥ÀÌÅÍ ºÐ¼®À» ¼öÇàÇÒ ¼ö·Ï ´õ °íÂ÷¿øÀûÀÎ È°¿ëÀÌ °¡´ÉÇØÁý´Ï´Ù. »ó´Ü À̹ÌÁöÀÇ ¼¼·ÎÃàÀÌ ÀǹÌÇÏ´Â °ÍÀÌ ´Ü¼ø ¸®Æ÷Æ®¿¡¼­ºÎÅÍ ÃÖÀûÈ­±îÁö µ¥ÀÌÅÍÀÇ È°¿ë¹æ½ÄÀÇ ´Ü°èÀÔ´Ï´Ù. °¡·ÎÃàÀÇ µ¥ÀÌÅÍ ºÐ¼® ¹æ½ÄÀÌ °íµµÈ­µÉ ¼ö·Ï °íÂ÷¿øÀÇ È°¿ë¹æ½ÄÀÌ °¡´ÉÇØÁø´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ½À´Ï´Ù. ±×¸®°í ÀÌ·¯ÇÑ µ¥ÀÌÅÍ ºÐ¼®È°µ¿¿¡¼­ ÇÙ½ÉÀûÀÎ ¿ªÇÒÀ» ¼öÇàÇÏ´Â °ÍÀÌ ¹Ù·Î ¸Ó½Å·¯´×ÀÔ´Ï´Ù. ¸Ó½Å·¯´×Àº ¿¹ÃøºÐ¼®À̳ª ÃÖÀûÈ­ È°µ¿¿¡¸¸ Àû¿ëµÈ´Ù°í ¾Ë°í ÀÖ´Â °æ¿ì°¡ ¸¹Àºµ¥ ÀüÇô ±×·¸Áö ¾Ê½À´Ï´Ù. ¼ö¸¹Àº ¸Ó½Å·¯´× ¾Ë°í¸®ÁòµéÀÌ Å½»öÀû, Ãß·ÐÀû µ¥ÀÌÅÍ ºÐ¼®¿¡¼­µµ È°¿ëµË´Ï´Ù. Áï, ¸Ó½Å·¯´×Àº µ¥ÀÌÅÍ¿¡ ±â¹ÝÇÑ ¿¹ÃøÀ» À§Çؼ­¸¸ Á¸ÀçÇÏ´Â °ÍÀÌ ¾Æ´Ï´Ù¶ó´Â Á¡Àº ºÐ¸íÈ÷ ¤°í ³Ñ¾î°¡¾ß ÇÕ´Ï´Ù.

µ¥ÀÌÅÍ ºÐ¼®ÀÇ ¿ä°Ç

Á¶Á÷ Àüü¿¡ °ÉÄ£ µ¥ÀÌÅÍ ºÐ¼®ÀÌ ±àÁ¤ÀûÀÎ È¿°ú¸¦ °¡Á®¿À±â À§Çؼ­´Â µ¥ÀÌÅÍ ¿£Áö´Ï¾î¸µÀ» ÅëÇØ °íÇ°ÁúÀÇ µ¥ÀÌÅÍ°¡ È¿À²ÀûÀ¸·Î ÀúÀåµÇ°í ¾ÈÀüÇÏ°Ô À¯ÅëµÇ¾î¾ß ÇÏ´Â °ÍÀÌ ÇʼöÀÔ´Ï´Ù. ÇÏÁö¸¸ À̰͸¸À¸·Î ¸ðµç ¿ä°ÇÀÌ ÃæÁ·µÇ¾ú´Ù°í º¼ ¼ö´Â ¾ø½À´Ï´Ù. ÇÑ °¡Áö ¿ä°ÇÀÌ ¹Ýµå½Ã ´õ ÃæÁ·µÇ¾î¾ß Çϴµ¥ ±×°ÍÀº ¹Ù·Î °í¼º´ÉÀÇ ¿¬»ê Ç÷§ÆûÀÔ´Ï´Ù.

µ¥ÀÌÅÍ ºÐ¼®È°µ¿ÀÇ ¼öÇà °üÁ¡ÀÇ º»ÁúÀº ´ë¿ë·® µ¥ÀÌÅÍ¿¡ ´ëÇÑ ¼öÇÐ / Åë°èÀû ¿¬»êÀÔ´Ï´Ù. ºñ±³Àû ´Ü¼øÇÑ Æò±Õ, ºÐ»ê µî ±âÃÊ Åë°è¿¡¼­ºÎÅÍ º¹ÀâÇÑ ¸Ó½Å·¯´× ¾Ë°í¸®Áò¿¡ À̸£±â±îÁö µ¥ÀÌÅÍ ºÐ¼®À» ¼öÇàÇÑ´Ù´Â °ÍÀº °á±¹ ¹Ýº¹ÀûÀ¸·Î ´ë¿ë·® µ¥ÀÌÅÍ¿¡ ´ëÇØ ¿¬»êÀ» ¼öÇàÇÏ´Â °ÍÀÔ´Ï´Ù. ÇϳªÀÇ ¿¬»êÀ» ¼öÇàÇÏ´Â ½Ã°£ÀÌ ±æ¾îÁú¼ö·Ï ÇØ´ç ¿¬»êÀÌ ¹Ýº¹µÇ´Â Ƚ¼öÀÇ ¹è¼ö¸¸Å­ ºÐ¼® ¼º´ÉÀº ÀúÇÏµÇ°Ô µË´Ï´Ù. µ¥ÀÌÅÍ »çÀ̾ðƼ½ºÆ®µéÀÌ ÇÑ ¹ø ºÐ¼®ÀÛ¾÷À» ½ÇÇàÇÏ°í ¹ã»õ ±â´Ù·È´Âµ¥ °á±¹ ¸Þ¸ð¸® ºÎÁ·À¸·Î ¿À·ù°¡ ¹ß»ýÇÏ´Â ½½Ç Çö½ÇÀº Áö±Ýµµ ºó¹øÈ÷ ÀϾ°í ÀÖ½À´Ï´Ù. Áï, µ¥ÀÌÅÍ ºÐ¼®¿¡ ´ëÇÑ ¿ä°ÇÀÌ °­È­µÉ¼ö·Ï °í¼º´É µ¥ÀÌÅÍ ¿¬»ê¿¡ ´ëÇÑ ¿ä°Ç ¿ª½Ã Ä¿Áö´Â °ÍÀº ´ç¿¬ÇÑ °á°úÀÔ´Ï´Ù. µ¿½Ã¿¡ ¿Ö ºòµ¥ÀÌÅÍÀÇ 3V Áß Çϳª°¡ ¼Óµµ (Velocity) ÀÎÁö ¾Ë ¼ö ÀÖ°Ô µË´Ï´Ù.

µ¥ÀÌÅÍ ºÐ¼®ÀÇ ¿¬»êÀÇ Æ¯¼ºÀº Å©°Ô µÎ °¡ÁöÀÔ´Ï´Ù.
1. ´ë¿ë·® µ¥ÀÌÅÍ : ¿¬»êÀ» ¼öÇàÇÒ ´ë»óÀÌ µÇ´Â µ¥ÀÌÅÍÀÇ ¿ë·®ÀÌ Å­
2. ´Ü¼ø¹Ýº¹ ¿¬»ê : ºñ±³Àû ´Ü¼øÇÑ ¿¬»êÀ» ¹Ýº¹ÀûÀ¸·Î ¼öÇàÇÔ

°á±¹ ¸¹Àº µ¥ÀÌÅÍ¿¡ ´ëÇØ ºñ±³Àû ´Ü¼øÇÑ °è»êÀ» ¹Ýº¹ÀûÀ¸·Î ¼öÇàÇÏ´Â °ÍÀ̸ç, ÀÌ·¯ÇÑ Æ¯¼ºÀ» °í·ÁÇÒ ¶§ º´·Ä ¾ÆÅ°ÅØÃÄ°¡ µ¥ÀÌÅÍ ºÐ¼® ¿¬»ê¿¡´Â ¸Å¿ì ÀûÇÕÇÏ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ½À´Ï´Ù. »ç¶÷À¸·Î ºñÀ¯ÇÏÀÚ¸é µ¥ÀÌÅÍ ºÐ¼® ¿¬»êÀ» ¼öÇàÇÒ ¶§´Â ÇϹöµå ÀÀ¿ë¼öÇаú ¹Ú»ç 1¸íº¸´Ù ¹ÌÀûºÐÀ» ¹è¿î °íµîÇлý 10¸íÀÌ ³´½À´Ï´Ù. ÃÊ°í¼º´ÉÀÇ ´ÜÀÏ ¼­¹öº¸´Ù º¹¼öÀÇ Àú¼º´É ³ëµåµéÀ» º´·ÄÀûÀ¸·Î ¿¬°áÇÑ Å¬·¯½ºÅÍ°¡ µ¥ÀÌÅÍ ºÐ¼®¿¡¼­´Â ´õ ¶Ù¾î³­ ¼º´ÉÀ» º¸¿©ÁÝ´Ï´Ù. ¼Ò¼öÀÇ °í¼º´É ÄÚ¾î·Î ±¸¼ºµÈ CPUº¸´Ù ´Ù¼öÀÇ Àú¼º´É ÄÚ¾î·Î ±¸¼ºµÈ GPU°¡ ¸Ó½Å·¯´×¿¡ ÈξÀ ÀûÇÕÇÑ °Íµµ °°Àº ¿ø¸®ÀÔ´Ï´Ù. ÀÌ·¯ÇÑ º´·Ä ¾ÆÅ°ÅØÃĸ¦ MPP (Massive Parallel Processing) ¾ÆÅ°ÅØÃĶó°í ÇÕ´Ï´Ù. Spark, Vertica, ±× ¿Ü »ó¿ë ¸Ó½Å·¯´× Ç÷§ÆûµéÀº ¿¹¿Ü¾øÀÌ MPP ¾ÆÅ°ÅØÃÄ¿¡ ±â¹ÝÇÏ°í ÀÖ½À´Ï´Ù.


°ü·Ã Á¦Ç° : MicroStrategy