BlogTODAYS PICKS SubTrend 레디 데이터(Ready Data)란? 20년 치 데이터가 쌓여도, AI가 못 읽는 이유 TREND by Miyeon. Jo 2026년 07월 01일 2026년 07월 01일 1.8K 제조업에서 AI란 실제 현장 안에 존재합니다. 설비 이상을 감지하고, 불량품을 걸러내고, 로봇의 움직임을 결정하죠. 그러므로 챗봇이 틀린 답을 내놓으면 다시 물어보면 그만이지만, 공장 안 피지컬 AI가 잘못된 판단을 내리면 설비 오작동이나 안전사고로 이어질 수 있어요. 제조업 AI에서는 정확성이 무엇보다 중요한 이유입니다.그리고 그 정확성은 데이터에서 시작됩니다. 하지만, 많은 제조 기업이 보유한 데이터가 많다고 하더라도,데이터가 많은 것과 AI가 쓸 수 있는 데이터가 많은 것은 사실 전혀 다른 이야기인데요. 제조 현장에서 AI가 작동하기 위한 조건, 레디 데이터에 대해 알아보겠습니다. 레디 데이터: AI가 읽을 수 있는 데이터 데이터만 있으면 AI 학습이 가능할까요? 그렇지 않습니다. 데이터 중에서도 쓸 수 있는 것이 있고, 그렇지 못한 것이 있어요. AI 학습에 쓸 수 있는 데이터를 ‘레디 데이터(AI Ready Data)’라고 합니다. 레디 데이터는 말 그대로 AI를 위해 준비된 데이터입니다. AI가 학습하거나 답변에 바로 활용할 수 있도록 가공된 상태를 의미합니다. 흔히 기업들은 데이터가 많이 축적됐으니 AI 경쟁력이 있다고 착각하는 경우가 많습니다. 하지만 AI 훈련에 적합하도록 정제된 데이터가 아니라면 쓸 수 없어요. 오히려 정제되지 않은 데이터를 AI 학습에 활용하면 잘못된 결과를 내는 원인이 됩니다.제조업에서 말하는 AI는 로봇팔, 비전 AI, 예지보전 시스템과 같은 피지컬 AI입니다. 피지컬 AI는 조금의 오차도 허용되지 않습니다. 오류가 곧바로 현장에서 드러나기 때문이죠. 그렇기에 오차가 용납되지 않는 환경일수록, 어떤 데이터로 학습시켰느냐가 중요합니다. 즉, 피지컬 AI의 정확성은 곧 레디 데이터의 품질에서 시작합니다. 그렇다면 일반 데이터와 비교했을 때, 어떤 조건을 갖춰야 레디 데이터라고 할 수 있을까요? 설비 오작동이나 안전사고를 막기 위해 미세한 오차도 허용하지 않는 제조업 분야에서는, 오류 없는 고품질의 ‘레디 데이터’ 확보가 피지컬 AI의 정확성을 결정짓는 출발점이다. (사진=생성형 AI 제작) 20년 치 데이터가 쌓여있어도 네 가지가 안 맞으면 소용없다 제조 공장에는 수십 년 치 센서 데이터가 쌓여있습니다. 많은 제조 기업은 보유한 데이터양이 많으니, ‘이거 그냥 AI에 바로 갖다 쓰면 되는 거 아니야?’라고 생각하는 경우가 많은데요. 하지만 데이터가 쌓여있다고 해서 그걸 AI 학습에 바로 활용할 수 있는 건 아닙니다. 실제로 제조 현장의 데이터를 들여다보면 예상보다 훨씬 상태가 좋지 않은 경우가 대부분이죠. 데이터가 많아도 AI에 바로 쓸 수 없는 이유는 크게 네 가지로 정리할 수 있어요. 제조업 레디 데이터, 바로 쓸 수 없는 이유 ① 형식 불일치 20년 치 온도 데이터가 있다고 가정해 볼게요. 중간에 기계를 교체하면서 섭씨에서 화씨로 단위가 바뀌었을 수 있습니다. 정전으로 중간중간 데이터가 빠져 있을 수도 있어요. 어떤 설비는 1초에 한 번, 어떤 설비는 10분에 한 번 데이터를 내보내기도 합니다. 이처럼 형식이 제각각인 데이터를 그대로 AI에 넣으면 학습이 되지 않습니다. 제조업 레디 데이터, 바로 쓸 수 없는 이유 ② 시간 동기화 문제 여러 설비에서 나오는 데이터는 각자의 주기로 수집됩니다. AI가 설비 간의 관계를 파악하려면 데이터의 시간 축이 일치해야 해요. 시간 동기화가 안 된 상태에서는 어떤 설비에서 어떤 일이 언제 일어났는지를 AI가 연결해서 이해할 수 없습니다. 제조업 레디 데이터, 바로 쓸 수 없는 이유 ③ 맥락 레이블링 문제 단순히 ‘이상 발견’이라고 기록된 데이터는 AI에게 의미가 없습니다. 온도가 갑자기 올라갔을 때 옆 설비가 멈췄다거나, A 공정에서 B가 이렇게 됐고 C가 이렇게 됐으니 이런 문제라는 맥락을 도메인 전문가가 일일이 레이블링해줘야 해요. 그때 비로소 데이터가 학습을 시작할 수 있습니다. 제조업 레디 데이터, 바로 쓸 수 없는 이유 ④ 구조적 한계 여기에 더해 구조적인 문제도 있어요. 요즘 나오는 설비들은 대부분 API가 만들어져 있어 데이터를 쉽게 추출할 수 있습니다. 하지만 10~15년 전 설비들은 데이터를 뽑아낼 수 없는 경우가 많습니다. 지멘스 같은 글로벌 설비 회사도 당시에는 AI가 데이터를 읽을 것을 예상하지 못했기 때문입니다. 새로 개발해야 하지만 설비 제조사가 지원해줄 이유도 없죠. 잘 돌아가고 있는 설비를 AI 도입을 위해 전부 교체할 수도 없고요. 그래서 공장 현장에서는 데이터 연결조차 안 된다는 말이 자주 나옵니다. 제조 공장에 수십 년간 축적된 데이터라도 형식 불일치, 시간 미동기화, 맥락 부재, 구조적 단절 등의 문제를 해결하지 않으면 AI 학습에 활용할 수 없다. (사진=생성형 AI 제작) 제조업 레디 데이터 시작점, 산업이 아닌 업무 단위로 찾아라 레디 데이터 구축이 이렇게 복잡하다면 어디서부터 시작해야 할까요? 답은 하나입니다. 전체를 한 번에 하려 하지 말고, 효과를 낼 수 있는 부분부터 쪼개서 시작하는 것입니다. 완벽하게 다 갖추고 시작하려 하면 아무것도 시작할 수 없어요. 범위를 좁혀 접근하는 것이 오히려 제조 AI로 빠르게 가는 지름길이 됩니다.그런데 여기서 어떤 산업인지, 어떤 공정인지부터 따지다 보면 시작 자체가 늦어질 수 있어요. 레디 데이터 시작점을 찾을 때는 산업이 아닌 업무 단위로 접근하는 것이 가장 현실적인 방법입니다. 어떤 공장이든 공통으로 반복되고, 시간을 많이 빼앗기는 작업이 있기 마련이죠. 이런 일부터 레디 데이터를 만들어가면, 데이터 준비의 범위를 좁힐 수 있습니다. 대표적인 시작점 세 가지입니다. 제조업 레디 데이터 업무 ① 테스트 보고서 자동화 엔지니어들은 제품이 나오면 검사를 하고 테스트 보고서를 작성해 ERP에 입력해야 합니다. 반복적이고 시간이 오래 걸리는 작업이에요. 비전 AI나 OCR을 활용해 자동으로 읽어서 ERP에 입력하는 것부터 시작할 수 있습니다. 제조업 레디 데이터 업무 ② 사내 지식 기반 챗봇 공장에 오래 있다고 해서 모든 매뉴얼을 숙지하고 있는 것은 아닙니다. 돌발 상황이 생겼을 때 두꺼운 매뉴얼을 뒤적이는 대신, 사내 매뉴얼을 학습시킨 챗봇에 자연어로 물어보면 바로 답을 얻을 수 있어요. 현장에서 시간을 크게 절약할 방법입니다. 제조업 레디 데이터 업무 ③ 예지보전 고장이 자주 나고 임팩트가 큰 설비부터 센서를 달아 데이터를 수집하고, 이상 징후를 미리 감지하는 것입니다. 앞선 두 가지보다 난도가 높지만, 효과가 가장 직접적으로 드러나는 영역이에요. 제조업 레디 데이터 최종 과제: OT, IT 이렇게 태스크 단위로 경험을 쌓아가다 보면 결국 더 큰 과제와 마주하게 됩니다. 바로 OT와 IT 데이터의 통합입니다. 공장 설비에서 나오는 OT 데이터와 ERP 같은 IT 시스템 데이터는 언어 자체가 달라요. 지금까지는 최소한의 필요에 의해 몇 개의 OT 데이터만 불러와 IT 시스템에 연결하는 방식으로 써왔습니다. 📌 IT (Information Technology) ERP, MES 등 기업 운영에 필요한 데이터를 관리하고 처리하는 소프트웨어 중심의 기술 영역. 생산 계획, 재고 관리, 품질 기록 등 경영 데이터를 다루는 기술입니다. 📌 OT (Operational Technology) 공장 설비, 센서, 로봇 등 물리적 장비를 직접 제어하고 운영하는 기술 영역. 온도, 압력, 진동 등 현장에서 실시간으로 발생하는 데이터를 다루는 기술입니다. 하지만 지금은 AI 때문에 모든 데이터가 다 필요해졌어요. Modbus, MQTT 등 OT 프로토콜을 IT 시스템에 맞게 변환하는 작업은 AI 전문가만으로는 불가능하고, 공장 설비 언어를 아는 도메인 전문가가 반드시 함께해야 합니다.그렇기 때문에 지금 당장 완벽한 통합을 목표로 할 필요는 없습니다. 성과가 보이는 작은 단위부터 시작해 데이터를 하나씩 정제하고, 그 경험을 쌓아가며 범위를 넓혀가는 것이 레디 데이터 구축의 현실적인 경로입니다. 이 과정이 시간도 오래 걸리고 힘든 작업이지만, 결국 제조 AI로 가장 빠르게 갈 수 있는 지름길이 됩니다. 완벽한 통합을 조급하게 추진하기보다, 당장 효과를 낼 수 있는 태스크 단위부터 시작해 IT와 OT의 데이터 범위를 점진적으로 넓혀가는 것이 현실적인 지름길이다. (사진=생성형 AI 제작) 레디 데이터, 지금 시작해야 하는 이유 제조 AI의 성패는 기술이 아닌 데이터에서 갈립니다. 형식이 맞지 않고, 시간 동기화가 안 되고, 맥락 레이블링이 없는 데이터는 아무리 많아도 AI가 읽을 수 없습니다. 중요한 것은 완벽한 준비가 아니라 지금 당장 시작하는 것입니다. 빠르게 성과를 확인할 수 있는 영역부터 먼저 시작하고, 그 경험을 쌓아가며 OT·IT 통합이라는 더 큰 과제로 나아가는 것이 레디 데이터 구축의 현실적인 경로입니다.레디 데이터 구축은 하루아침에 완성되지 않습니다. 시간도 오래 걸리고, 리소스도 많이 필요한 작업입니다. 하지만 지금 시작하지 않으면 나중에 더 많은 시간을 잃게 됩니다. 올해 레디 데이터에 투자해야 하는 이유가 바로 여기에 있습니다. 이 데이터를 기반으로 AI 에이전트를 어떻게 설계해야 현장에서 작동하는지는 ‘제조업 AI 에이전트, 이렇게 설계해야 현장에서 작동합니다’ 에서 이어서 확인해보세요.베스핀글로벌은 PoC부터 운영까지 제조 AI 전환의 전 과정을 함께합니다. 사내 지식 매뉴얼 구축부터 OT·IT 데이터 통합까지, 단계별로 포기하지 않고 끝까지 동행하는 파트너십을 지향합니다. 제조 AI 전환을 준비하고 있다면 베스핀글로벌과 함께 시작해보세요. 관련 상품 제조 AI 빅데이터 방금 읽은 인사이트를 실무에 직접 적용하고 싶으시다면?지금 바로 베스핀글로벌에 문의하세요. 문의하기 더 읽어볼 만한 컨텐츠 피지컬 AI 시대, 제조업이 지금 준비해야 할 것 | 베스핀글로벌 제조 버티컬 BDE 담당 황상원 상무 인터뷰 제조업 AI 에이전트, 이렇게 설계해야 현장에서 작동합니다 목차 레디 데이터(Ready Data)란? 20년 치 데이터가 쌓여도, AI가 못 읽는 이유 레디 데이터: AI가 읽을 수 있는 데이터 20년 치 데이터가 쌓여있어도 네 가지가 안 맞으면 소용없다 제조업 레디 데이터, 바로 쓸 수 없는 이유 ① 형식 불일치 제조업 레디 데이터, 바로 쓸 수 없는 이유 ② 시간 동기화 문제 제조업 레디 데이터, 바로 쓸 수 없는 이유 ③ 맥락 레이블링 문제 제조업 레디 데이터, 바로 쓸 수 없는 이유 ④ 구조적 한계 제조업 레디 데이터 시작점, 산업이 아닌 업무 단위로 찾아라 제조업 레디 데이터 업무 ① 테스트 보고서 자동화 제조업 레디 데이터 업무 ② 사내 지식 기반 챗봇 제조업 레디 데이터 업무 ③ 예지보전 제조업 레디 데이터 최종 과제: OT, IT 레디 데이터, 지금 시작해야 하는 이유 제조업AI 이전 글 제조업 AI 에이전트, 이렇게 설계해야 현장에서 작동합니다 다음 글 피지컬 AI 시대, 제조업이 지금 준비해야 할 것 | 베스핀글로벌 제조 버티컬 BDE 담당 황상원 상무 인터뷰