AI 프로젝트 개발 – 프로젝트 관리자가 준비해야 하는 방법
게시 됨: 2022-03-11이 기사의 오디오 버전을 들어보세요
프로젝트 관리자로서 귀하는 경력 전반에 걸쳐 복잡한 모놀리식 구조에서 SaaS 웹 앱에 이르는 수많은 IT 프로젝트에 참여했을 것입니다. 그러나 인공 지능과 머신 러닝의 발전으로 요구 사항과 문제가 다른 새로운 프로젝트가 빠른 속도로 수평선에 등장하고 있습니다.
이러한 기술의 등장으로 "있으면 좋은 것"이 아니라 기술 프로젝트 관리자가 이러한 개념과 건강한 관계를 유지하는 것이 필수적입니다. Gartner에 따르면 AI는 2020년까지 230만 개의 일자리를 창출하고 제거될 180만 개를 초과하여 2021년까지 2조 9천억 달러의 비즈니스 가치를 창출할 것입니다. Google의 CEO는 "AI는 가장 중요한 것 중 하나입니다. 인류가 노력하고 있습니다. 그것은 전기나 불보다 더 심오합니다.”
인공 지능의 응용 프로그램은 이미 금융에서 의료에 이르기까지 다양한 산업을 혼란에 빠뜨리고 있으므로 이 기회를 포착할 수 있는 기술 PM은 AI 프로젝트 관리가 어떻게 구별되고 변화하는 환경에 가장 잘 대비할 수 있는지 이해해야 합니다.
이론
모든 것의 의미: AI 대 ML
더 깊이 들어가기 전에 AI가 실제로 무엇인지 확실히 이해하는 것이 중요합니다. 종종 같은 의미로 사용되는 다양한 용어가 있으므로 먼저 가장 일반적인 정의를 살펴보겠습니다.
인공 지능(AI)
AI는 패턴 인식, 학습 및 일반화와 같이 인간 지능이 필요한 문제를 해결하는 데 전념하는 컴퓨터 과학 분야입니다.
이 용어는 실제 인식이 가능한 자가 인식 컴퓨터 프로그램을 나타내는 인공 일반 지능(AGI)을 나타내기 위해 최근 몇 년 동안 남용되었습니다. 그럼에도 불구하고 가까운 미래에 대부분의 AI 시스템은 컴퓨터 과학자들이 "협소한 AI"라고 부르는 것입니다. 즉, 스스로 "생각"하기보다는 하나의 인지 작업을 정말 잘 수행하도록 설계될 것입니다.
머신 러닝(ML)
머신 러닝은 통계 기술을 사용하여 컴퓨터에 명시적으로 프로그래밍하지 않고도 데이터에서 학습할 수 있는 기능을 제공하는 인공 지능의 하위 집합입니다.
AI와 ML은 AI 분야에서 일부 기계 학습 방법의 성공으로 인해 최근 몇 년 동안 많은 회사에서 상호 교환적으로 사용되었습니다. 분명히 말해서, 기계 학습은 프로그램의 학습 능력을 나타내는 반면 인공 지능은 다른 기능과 함께 학습을 포함합니다.
신경망과 딥 러닝에 대한 자세한 내용은 이 기사 끝에 있는 부록을 참조하세요.
중요한 차이점: AI 대 표준 알고리즘
AI의 핵심 테이크아웃은 알고리즘이 많은 양의 데이터를 사용하여 내부 구조를 조정하여 새로운 데이터가 표시될 때 제공된 이전 데이터에 따라 분류된다는 것입니다. 우리는 이것을 코드에 엄격하게 쓰여진 분류 지침에 따라 작동하는 것이 아니라 데이터에서 "학습"이라고 부릅니다.
자동차와 트럭을 구별할 수 있는 프로그램을 작성하고 싶다고 상상해 보십시오. 전통적인 프로그래밍 접근 방식에서는 더 큰 바퀴나 더 긴 몸체와 같은 구체적이고 표시적인 기능을 찾는 프로그램을 작성하려고 했습니다. 이러한 기능이 어떻게 보이는지, 사진에서 찾을 수 있는 위치를 구체적으로 정의하는 코드를 작성해야 합니다. 그러한 프로그램을 작성하고 안정적으로 작동하게 하는 것은 매우 어렵고, 결국에는 전혀 사용할 수 없을 정도로 위양성과 위음성을 모두 내보냅니다.
여기서 AI 알고리즘이 매우 유용해집니다. AI 알고리즘이 훈련되면 많은 예를 보여줄 수 있으며 정적이고 규정된 특징 정의에 의존하는 대신 사진의 성공적인 분류와 관련된 특징을 감지하기 시작하도록 내부 구조를 조정합니다.
AI 프로젝트 관리 실습
데이터는 왕이다
인간은 많은 양의 데이터를 다루는 데 능숙하지 않으며 우리가 사용할 수 있는 엄청난 양의 데이터로 인해 때때로 직접 사용하지 못합니다. 여기에 AI 시스템이 등장합니다.
AI 시스템과 관련된 매우 핵심 개념은 예측이 데이터만큼 우수하다는 것입니다. 예를 들어, 백만 개의 데이터 포인트가 있는 알고리즘은 10,000개의 데이터 포인트가 있는 동일한 알고리즘보다 성능이 뛰어납니다. 또한 BCG는 “많은 기업이 AI 성공에 대한 데이터와 교육의 중요성을 이해하지 못하고 있습니다. 종종 인간의 자연보다 양육이 더 중요하듯이, 더 나은 데이터는 더 나은 알고리즘보다 지능 시스템을 구축하는 데 더 중요합니다.”
이러한 지식을 바탕으로 데이터를 준비하고 정리하는 것이 프로젝트 프로세스에서 더 널리 퍼질 것입니다. 대부분의 기업이 올바른 형식으로 데이터를 준비하지 못하기 때문에 이 단계는 AI 시스템 구축에서 가장 노동 집약적인 부분입니다. 따라서 데이터 분석가가 이 필수 단계를 완료하는 데 시간이 걸릴 수 있습니다.
또한 데이터 인프라 설정 및 데이터 정리 작업은 일반적인 소프트웨어 개발보다 훨씬 더 선형적이며 다른 프로젝트 관리 방법이 필요할 수 있습니다.
요약하자면, 데이터를 실행하기 위한 기계 학습 모델을 구축하는 것보다 올바른 데이터 인프라를 구축하고 사용할 데이터를 준비하는 데 훨씬 더 오래 걸릴 수 있습니다. 이는 프로젝트 관리자가 팀을 관리하고 AI 범위 및 프로젝트 견적에 대해 생각할 때 큰 고려 사항입니다.
또한 데이터 세트는 새로운 데이터로 지속적으로 업데이트되어야 합니다. 고유한 데이터 세트에 대한 액세스는 가장 성공적인 ML 제품을 정의하는 주요 결정 요소일 수 있습니다. 출시 후에도 ML 프로젝트에 대한 최상의 성능을 달성하려면 이에 대한 최신 정보를 유지하는 것이 중요합니다.
AI 개발 수명 주기
대부분의 사람들은 표준 시스템 개발 수명 주기(SDLC)와 다양한 방법론 및 기술이 SDLC를 형성하는 방식에 익숙할 것입니다. AI 개발이 현장에 새로운 도전 과제를 가져올 것이라는 점에 주목하는 것이 중요합니다. AI 개발 수명 주기를 아이디어 및 데이터 발견, MVP 우선 순위 지정, MVP를 완전한 제품으로 개발하는 단계로 나눌 수 있습니다.
아이디어 및 데이터 검색
이 첫 번째 단계 에서는 ML 제품의 최종 사용자와 사용 가능한 데이터 풀의 두 가지 핵심 사항에 초점을 맞춰야 합니다.
두 개의 독립적인 측면에서 문제에 접근함으로써 이러한 기술은 프로젝트 관리자가 회사 내에서 사용할 수 있는 ML 제품 기회를 신속하게 좁히는 데 도움이 될 수 있습니다. 이 단계에서 최고 PM은 특정 문제를 해결할 수 있는 어려움을 더 잘 이해하기 위해 기계 학습 공간에 대한 지식을 활용할 수 있습니다. ML 분야에서는 상황이 매우 빠르게 진행되며 일부 어려운 문제는 연구의 새로운 발전으로 훨씬 쉽게 풀릴 수 있습니다.
앞서 언급했듯이 데이터가 발견되면 정리하고 준비해야 합니다. 이 특정 작업은 일반적으로 선형 단계로 수행되며, 이는 스프린트로 강제 할 수 있지만 Agile 또는 Waterfall과 같은 일반적인 프로젝트 방법론에 깔끔하게 맞지 않습니다. 일반적으로 데이터 정리는 데이터 세트의 크기를 점진적으로 늘리고 다른 개발 노력과 병행하여 준비하는 방식으로 반복적으로 수행됩니다.
최소 실행 가능 제품(MVP) 우선 순위 지정
아직 완성되지 않은 큰 제품보다 작은 제품의 작업 프로토타입이 있는 것이 더 낫다는 사실은 여전히 머신 러닝 제품과 함께 존재합니다. 새로운 ML MVP는 제공 속도와 회사에 대한 가치에 따라 우선 순위를 지정해야 합니다. 작은 제품이라도 빠른 속도로 제품을 제공할 수 있다면 팀 전체에 빠르고 좋은 성과를 거둘 수 있습니다. 이러한 제품의 우선 순위를 지정해야 합니다.
이러한 MVP를 고전적인 애자일 방식으로 준비하는 것은 좋은 생각이며, 개발 팀은 데이터 팀이 독립적으로 준비한 지속적으로 개선되는 데이터 세트를 기반으로 ML 모델을 제공하는 데 집중해야 합니다. 여기서 중요한 차이점 은 데이터 팀이 MVP를 구축하는 팀과 동일한 스프린트 구조를 통해 작업할 필요가 없다는 것 입니다.
본격적인 제품에 MVP
이 단계에서 데이터 인프라가 핵심이 됩니다. ML 제품에 전 세계의 고주파 API 액세스가 필요한 경우 이제 ML 제품을 지원하도록 인프라를 확장할 수 있는 방법을 고려해야 합니다.
여기에서 현재 제품의 성능이 저하되지 않도록 ML 모듈에 대한 변경 사항을 신중하게 평가해야 합니다. 새로운 알고리즘이나 데이터 세트로 ML 모듈을 재교육하는 것이 항상 선형 성능 향상을 가져오는 것은 아닙니다. 따라서 실제 배포 전에 상당한 양의 테스트가 필요합니다. 에지 케이스 및 잠재적인 GAN(Generative Adversarial Network) 공격에 대한 ML 모듈 테스트는 아직 초기 단계이지만 라이브 ML 제품을 실행할 때 프로젝트 관리자가 염두에 두어야 할 사항입니다.
AI 개발 수명 주기 내 주요 역할
ML 애플리케이션 개발의 데이터 집약적인 요구 사항은 AI 제품의 SDLC에 새로운 역할을 부여합니다. ML 애플리케이션 분야에서 훌륭한 프로젝트 관리자가 되려면 데이터 과학자, 데이터 엔지니어, 인프라 엔지니어라는 세 가지 역할에 매우 익숙해야 합니다. 기계 학습 엔지니어, 기계 학습 인프라 엔지니어 또는 기계 학습 과학자를 비롯한 다른 직함으로 위장하기도 하지만 이러한 핵심 직책과 ML 개발 프로세스에 미치는 영향을 확실히 이해하는 것이 중요합니다.
데이터 과학자
데이터 과학자는 기계 학습 모델을 구축하는 개인입니다. 그들은 응용 통계, 기계 학습 및 분석에 대한 깊은 이해를 기반으로 아이디어를 합성한 다음 실제 비즈니스 문제를 해결하기 위해 통찰력을 적용합니다.
데이터 과학자는 때때로 데이터 분석가의 고급 버전으로 간주됩니다. 그러나 데이터 과학자는 일반적으로 강력한 프로그래밍 기술을 보유하고 데이터 센터에 걸쳐 있는 많은 양의 데이터를 편안하게 처리하며 기계 학습에 대한 전문 지식을 갖추고 있습니다.
또한 데이터 인프라 및 빅 데이터 마이닝에 대해 잘 이해하고 스스로 탐색 연습을 수행하고 데이터를 보고 그 안에서 초기 단서와 통찰력을 찾을 수 있을 것으로 기대됩니다.
기본 기술: Python, R, Scala, Apache Spark, Hadoop, 기계 학습, 딥 러닝, 통계, 데이터 과학, Jupyter, RStudio
데이터 엔지니어
데이터 엔지니어는 ML 제품이 작동하는 데 필요한 소프트웨어 및 인프라 구축을 전문으로 하는 소프트웨어 엔지니어입니다. 그들은 가장 중요한 아키텍처에 초점을 맞추는 경향이 있으며 기계 학습, 분석 또는 빅 데이터의 전문가는 아닐 수도 있지만 소프트웨어 및 인프라를 테스트하려면 이러한 주제에 대해 잘 이해하고 있어야 합니다. 이는 데이터 과학자가 생성한 기계 학습 모델을 성공적으로 구현하고 실제 세계에 노출할 수 있도록 하는 데 필요합니다.
기본 기술: Python, Hadoop, MapReduce, Hive, Pig, 데이터 스트리밍, NoSQL, SQL, 프로그래밍, DashDB, MySQL, MongoDB, Cassandra
인프라 엔지니어
인프라 엔지니어는 ML 제품의 백본인 인프라 계층을 관리합니다. 데이터 엔지니어가 이 인프라 중 일부를 구축할 수 있지만 인프라 팀이 준비하고 동의한 계층 위에 구축되는 경우가 많습니다.
인프라 엔지니어는 수백만 명의 사용자에게 서비스를 제공하도록 ML 앱을 확장할 수 있는 확장 가능하고 효율적인 환경을 만드는 것을 목표로 여러 ML 팀에서 작업할 수 있습니다. 인프라 엔지니어는 플랫폼의 소프트웨어 수준을 관리할 뿐만 아니라 데이터 센터 파트너와 협력하여 호스팅된 데이터의 지리적 위치에서 하드웨어에 이르기까지 모든 것이 원활하게 실행되도록 합니다. ML 프로젝트에서 이러한 측면이 중요해짐에 따라 AI 기반 기업에서 인프라 엔지니어의 중요성이 더욱 커지고 있습니다.
기본 기술: Kubernetes, Mesos, EKS, GKE, Hadoop, Spark, HDFS, CEPH, AWS, 클라우드 컴퓨팅, 데이터 센터 운영, 엔드 투 엔드 컴퓨팅 인프라, IT 인프라, 서비스 관리
오늘날의 일반적인 과제
AI 및 ML 기반 제품의 등장으로 프로젝트 관리자는 익숙하면서도 완전히 낯선 문제에 직면할 것으로 예상됩니다. 최고 PM은 프로젝트 범위 지정에서 완료에 이르기까지 전체 프로세스에서 이러한 잠재적 문제를 잘 알고 있습니다.
현실 점검
AI의 인기와 가능성에도 불구하고 해결하려는 문제에 정교한 AI 솔루션이 필요하지 않을 가능성이 큽니다 .
많은 예측 문제는 더 간단하고 경우에 따라 더 신뢰할 수 있는 통계 회귀 모델을 사용하여 해결할 수 있습니다. PM이 프로젝트를 시작하기 전에 문제에 머신 러닝이 필요한지 확인하기 위해 온전성 검사를 수행하는 것이 매우 중요합니다.

때로는 더 단순한 통계 모델로 시작하여 기계 학습 기반 솔루션과 병행하여 이동하는 것이 현명합니다. 예를 들어, 추천 엔진을 구축하는 경우 더 빠른 개발 수명 주기로 더 간단한 솔루션으로 시작하여 후속 ML 모델이 더 나은 성능을 발휘해야 하는 좋은 기준선을 제공하는 것이 현명할 수 있습니다.
AI 스코프 크립
ML 프로젝트에서 범위 크립의 가장 일반적인 원인은 한 번에 너무 많은 일을 하려고 하고 데이터를 준비하는 데 필요한 노력을 과소평가하는 것과 관련이 있습니다.
첫 번째 문제를 해결하려면 이해 관계자를 관리하여 거창한 계획보다 빠른 성공으로 시작하는 것이 더 낫다는 것을 이해하도록 관리하십시오. 빌드 및 테스트할 때 프로젝트 전체에서 이 접근 방식을 지속적으로 전달합니다.
쉽게 정의하고 테스트할 수 있는 작고 원자적인 기능으로 시작하십시오. 복잡한 작업을 수행하고 있는 자신을 발견하면 주요 작업에 대한 좋은 대용물인 더 간단한 작업으로 나누십시오. 이러한 작업이 달성하기 위해 설정한 내용을 쉽게 전달할 수 있어야 합니다.
예를 들어 사용자가 특정 광고를 클릭할 때를 예측하려는 경우 먼저 사용자가 광고를 완전히 닫을지 여부를 예측할 수 있습니다. 이 접근 방식에서는 문제가 단순화되고 현재 ML 모델에서 더 잘 수용하고 예측할 수 있습니다. Facebook은 모델의 시작부터 제공까지의 ML 파이프라인에 더 중점을 두고 이 주제에 대해 더 깊이 있는 훌륭한 시리즈를 만들었습니다.
범위 이동의 두 번째 기여자를 해결하려면 ML 프로젝트를 지원하기 위해 데이터를 준비할 수 있는지 확인하십시오. 필요한 형식으로 필요한 데이터가 있다고 가정하는 것만으로 PM이 ML 프로젝트를 시작할 때 저지르는 가장 흔한 실수입니다. 데이터 준비 및 정리는 종종 ML 프로젝트 프로세스의 더 긴 부분이기 때문에 이 단계를 관리하는 것이 필수적입니다. 데이터 과학자가 올바른 데이터에 액세스할 수 있는지 확인하고 구축하려는 ML 기능을 제안 하기 전에 데이터의 품질과 유효성을 확인할 수 있습니다.
프로젝트는 항상 더 나은 더 많은 데이터의 이점을 얻을 수 있으므로 초기자로서가 아니라 프로젝트 전반에 걸쳐 지속적인 연습으로 데이터 레이블 지정 및 정리를 준비하십시오. 이 단계가 가장 매력적인 작업이 아니므로 이 작업을 스프린트로 분할하여 데이터 팀이 끝없는 티켓 백로그에 직면하는 대신 노력의 진행 상황을 느낄 수 있도록 합니다.
때때로 회사는 데이터 라벨링을 제3자에게 아웃소싱합니다. 이는 시간과 초기 비용을 절약하는 데 도움이 될 수 있지만 신뢰할 수 없는 데이터를 생성하여 궁극적으로 ML 모델의 성공을 방해할 수도 있습니다. 이를 방지하려면 여러 당사자가 모든 데이터 조각을 확인하고 결과가 일치하는 경우에만 사용하는 다중 중첩 기술을 사용합니다.
프로젝트를 계획할 때 레이블 지정 요구 사항이 프로젝트 중간에 변경되어 레이블을 다시 지정해야 하는 경우 데이터 팀이 조정할 수 있는 충분한 시간을 확보하십시오.
마지막으로, 0에서 시작하면 프로젝트 시간과 범위가 크게 늘어날 수 있으므로 데이터를 새로운 ML 방법을 발명하는 대신 기존 ML 방법과 함께 쉽게 사용할 수 있는지 확인하십시오. 아직 풀리지 않은 ML 문제를 풀려고 하면 실패할 확률이 높다는 점에 유의하세요. 기계 학습의 성공과 출판된 연구 논문의 수에도 불구하고 ML 문제를 해결하는 것은 매우 어려운 노력이 될 수 있습니다. 좋은 예와 알고리즘이 많이 있는 ML 영역에서 시작하여 새로운 것을 발명하려고 하기보다 개선하려고 하는 것이 항상 가장 쉽습니다.
기계 학습, 기대 및 UX
모든 PM은 자신이 만들고 있는 AI 제품의 사용자 경험과 이를 구축하는 팀을 가장 잘 관리하는 방법에 대해 생각할 준비가 되어 있어야 합니다. Google은 인간 상호 작용에 중점을 두고 UX와 AI에 대한 사고 방식에 대한 훌륭한 글을 썼습니다.
이 점은 ML 제품이 운영자와 상호 작용하거나 운영자로 대체되어야 하는 경우 특히 중요합니다. 설계는 시스템 운영자와 사용자에게 필요한 최소한의 스트레스를 추가해야 합니다. 예를 들어, 챗봇은 종종 기계 학습을 기반으로 하지만 인간 운영자가 원활하게 인수할 수 있습니다.
이해 관계자가 제공할 수 있는 것보다 기계 학습 제품에서 훨씬 더 많은 것을 기대할 수도 있습니다. 이는 일반적으로 미디어가 AI 제품에 대해 글을 쓸 때 만들어내는 과대 광고에서 비롯되는 문제이므로 프로젝트 관리자가 합리적인 기대치를 설정하는 것이 중요합니다.
AI 도구가 실제로 무엇이며 이해 관계자를 위해 달성할 수 있는지 설명하여 도구를 테스트하기 전에 이해 관계자의 기대치를 충분히 관리할 수 있도록 하십시오. 좋은 UX는 훌륭하지만 비현실적인 기대를 가진 사용자에게 가치를 제공할 수 없으므로 관련된 PM이 이를 관리하고 이해 관계자에게 AI와 AI의 현실적인 기능에 대해 교육하는 것이 필수적입니다.
ML의 품질 보증(QA) 및 테스트 관행
현재 형태의 AI는 비교적 새로운 분야입니다. 목표를 달성하기 위해 딥 러닝을 사용하는 애플리케이션이 이렇게 많았던 적은 없었습니다. 이러한 새로운 개발에는 특히 테스트에서 고유한 일련의 과제가 있습니다.
사람들이 작성한 명확한 "규칙 세트"가 있는 표준 소프트웨어를 테스트하는 것은 비교적 쉽지만 머신 러닝 모델, 특히 신경망을 사용하여 구축된 모델을 철저하게 테스트하는 것은 훨씬 더 어렵습니다. 현재 대부분의 ML 모델은 데이터 과학자가 직접 테스트하지만 ML 제품이 예기치 않은 방식으로 실패하지 않도록 하기 위해 표준 QA 팀과 테스트하는 데 동의한 방법은 거의 없습니다.
이러한 GAN 공격과 같은 알려진 모델의 결과를 조작하는 새로운 방법으로 포괄적인 모델 테스트가 더욱 중요해질 것입니다. 이것은 많은 ML 프로젝트의 우선 순위가 될 것이며 앞으로 몇 년 안에 ML 모델에 대한 더 많은 "통합" 유형 테스트를 보게 될 것입니다. 대부분의 간단한 프로젝트의 경우 이것은 현재 실질적인 문제가 아닐 수 있지만 미션 크리티컬 ML 제품을 구축하는 경우 이를 염두에 두는 것이 중요합니다.
ML 모델 도용 및 표절
이 Wired 기사가 발표되고 2016년 USENIX Security 컨퍼런스에서 원본 논문이 발표된 이후, 라이브 ML 모델을 표절할 가능성이 있음이 명백해졌습니다.
이것은 여전히 잘 수행하기가 꽤 어렵지만 공개적으로 사용 가능한 API를 통해 실행되는 모델이 있는 경우 이 가능성을 인식하는 것이 중요합니다. 이론적으로 상당한 액세스 권한이 있는 당사자는 귀하를 기반으로 자체 네트워크를 훈련하고 귀하의 예측 기능을 효과적으로 복사할 수 있습니다.
이것은 가능성 면에서 여전히 매우 제한적이지만, 이것이 프로젝트에 대한 우려인 경우 가능한 공격에 대한 예방 전략에 대해 팀과 협력해야 합니다.
인재 부족
세계적 수준의 인공지능 전문가에 대한 수요로 인해 적합한 인재를 확보하기 위한 경쟁이 치열합니다. 실제로 New York Times는 세계적 수준의 AI 전문가가 실리콘 밸리의 거대 기술 강국에서 일하면서 연간 최대 100만 달러를 벌 수 있다고 보고합니다. PM으로서 팀에 합류할 AI 전문가를 찾는 동안 이러한 역학 관계가 고용 주기, 예산 또는 완료한 작업 품질에 영향을 미칠 수 있다는 점에 유의하십시오.
이러한 부족은 더 새로운 딥 러닝 알고리즘을 만드는 혁신적인 마음을 넘어서 확장되며 최고 품질의 데이터 엔지니어와 과학자에게도 해당됩니다.
가장 재능 있는 많은 사람들이 Kaggle과 같은 기계 학습 대회에 참가하여 어려운 기계 학습 문제를 해결하기 위해 10만 달러 이상의 상금을 거머쥘 수 있습니다. 로컬에서 ML 전문가를 고용하기 어려운 경우 원격으로 전문 계약자를 고용하거나 가장 어려운 ML 문제에 대해 자체 Kaggle 대회를 운영하는 것과 같은 기본 솔루션을 찾는 것이 좋습니다.
법적 및 윤리적 문제
프로젝트 관리에서 AI의 법적, 윤리적 문제는 두 가지입니다.
첫 번째 문제 세트는 ML 모델을 훈련하는 데 사용되는 데이터에서 비롯됩니다. 사용하는 데이터의 출처, 특히 데이터를 사용할 수 있는 권한과 데이터 사용을 허용하는 라이선스가 있는지 여부를 이해하는 것이 중요합니다.
올바른 유형의 라이선스가 없을 수 있는 데이터에 대해 훈련된 모델을 배포하기 전에 이러한 질문을 해결하기 위해 변호사와 상담하는 것이 항상 중요합니다. 이것은 비교적 새로운 분야이기 때문에 이러한 답변 중 많은 부분이 명확하지 않지만 PM은 팀이 사용 권한이 있는 데이터 세트만 사용하고 있는지 확인해야 합니다.
다음은 ML 알고리즘 교육을 위해 공개적으로 사용 가능한 데이터 세트의 좋은 목록입니다.
두 번째 문제는 시스템이 체계적인 편향을 일으키지 않도록 하는 것입니다. 최근 몇 년 동안 한 카메라 회사에서 미소 인식 기술이 특정 인종의 얼굴을 포함하는 데이터로만 훈련되었기 때문에 특정 인종의 사람만 감지한다는 사실을 인정해야 했던 수많은 문제가 있었습니다. 또 다른 예로는 대규모 소프트웨어 회사에서 인터넷 트롤 그룹이 공동으로 노력하여 인종적 비방과 거친 음모를 반복하면서 학습 후 며칠 후 자체 학습하는 Twitter 봇을 철회해야 했습니다.
이러한 문제의 정도는 경미하거나 프로젝트를 파괴할 수 있으므로 중요한 시스템을 개발할 때 PM은 그러한 가능성을 고려하고 가능한 한 빨리 예방해야 합니다.
좋은 기초는 튼튼한 구조로 이어집니다
요약하면, 임박한 AI 혁명은 종종 수정된 개발 프로세스, 다른 팀 유형 및 새로운 도전과 함께 제공되는 흥미롭고 역동적인 프로젝트 세트를 가져옵니다.
최고의 기술 프로젝트 관리자는 AI 기본 사항을 잘 이해하고 있을 뿐만 아니라 각 프로젝트 단계의 어려움과 팀과 함께 만들 수 있는 것이 무엇인지에 대한 직관도 가지고 있습니다. AI는 상용 기성품(COTS) 솔루션이 아니므로 특정 ML 제품을 구매하기로 선택한 회사라도 새로운 것을 테스트하고 데이터와 인프라를 올바르게 관리하는 데 투자해야 합니다.
인공지능의 등장과 함께 소프트웨어 제품의 종류와 그것을 만드는 과정이 변하고 있음은 자명하다. 이러한 새로운 개념을 파악하고 실행할 수 있는 프로젝트 관리자는 미래의 기계 학습 제품을 만드는 데 중요한 역할을 할 것입니다.
저자의 추가 자료
추가 이론: DL 및 NN
인공 지능(AI) 및 머신 러닝(ML)에 대한 보다 일반적인 표현 외에도 프로젝트 관리자는 딥 러닝(DL)과 신경망(NN)을 더 잘 구별할 수 있다는 이점을 누릴 수 있습니다.
딥 러닝(DL)
딥 러닝은 기존 작업별 알고리즘과 달리 학습 데이터 표현을 기반으로 하는 광범위한 기계 학습 방법 제품군의 일부입니다.
대부분의 최신 딥 러닝 모델은 다양한 다른 방법을 사용할 수 있지만 인공 신경망을 기반으로 합니다.
신경망(NN)
신경망은 생물학적으로 영감을 받은 연결된 수학적 구조로 AI 시스템이 제공된 데이터에서 학습할 수 있도록 합니다.
우리는 이러한 네트워크를 데이터 입력에 따라 열리거나 닫히는 수백만 개의 작은 게이트로 상상할 수 있습니다. 이러한 기술의 성공은 최근 몇 년 동안 GPU 컴퓨팅 성능의 성장으로 가능했으며 이를 통해 신경망 내부에서 더 많은 "작은 게이트"를 신속하게 조정할 수 있습니다.
신경망에는 여러 유형이 있으며 각각 고유한 사용 사례와 복잡성 수준이 수반됩니다. 다양한 유형의 신경망 아키텍처를 설명하는 데 사용되는 CNN(컨볼루션 신경망) 또는 RNN(재귀 신경망)과 같은 용어를 볼 수 있습니다.
신경망이 어떻게 보이고 기능하는지 더 잘 이해하기 위해 신경망이 활성화되어 있는 동안 어떻게 "보이는지"에 대한 훌륭한 3D 시각화가 있습니다.
AI에 대해 더 알고 싶으십니까?
이 글을 읽은 후 주제를 조금 더 깊이 탐구하고 싶다면 다음 출처를 확인하는 것이 좋습니다.
신경망 이해하기
신경망의 작동 원리에 대해 더 자세히 알고 싶다면 YouTube의 신경망에 대한 3Blue1Brown 시리즈를 확인하는 것이 좋습니다. 제 생각에는 이것이 신경망에 대한 최고의 심층 설명입니다. 간단한 용어로 제공되며 사전 지식이 필요하지 않습니다.
AI 뉴스로 최신 정보 받기
학술 논문을 읽는 데 시간을 들이지 않고 AI 기술의 최신 발전을 확인하고 싶다면 다음 Two Minute Papers를 추천합니다. 이 채널은 가장 인상적인 새로운 AI 기술과 그 구현에 대한 2분짜리 업데이트를 매주 제공합니다.
ML 개발의 기초 배우기
직접 코드에 손을 대고 싶고 기본적인 Python 기술이 있는 경우 Fast.ai를 확인할 수 있습니다. 그들의 과정을 통해 기본적인 개발 기술을 갖춘 사람은 누구나 신경망을 실험하고 놀 수 있습니다.
기계 학습의 기초
이 제안은 처음부터 시작하여 기계 학습을 이해하고 구현하는 데 가장 높은 단계로 나아가고자 하는 사람들을 위한 것입니다.
이 과정을 통해 Coursera를 시작한 지금은 전설적인 Andrew Ng가 만든 이 과정은 상당한 시간 투자(최소 6개월)가 필요하지만 토요일을 보내는 매우 생산적인 방법이 될 수 있습니다.
참고: 주요 용어 정의는 Wikipedia에서 수정했습니다.