업데이트 노트

2026.01.02 04:49

스크래퍼 (배포보류)

아쉽지만 해당기능은 법률적 이슈가 있는것으로 확인 되었습니다.
법률 검토를 좀 더 거친 후에 공개여부를 결정 하는것이 좋을것같습니다.

스크래퍼는 외부 사이트의 게시글/상품 등의 데이터를
자동으로 수집하여, 내 사이트(DB/게시판)에 등록하는 규칙 기반 수집 프로그램입니다. 

URL과 추출 규칙(XPath/선택자 등)만 설정하면, 
사람이 수동으로 복사·붙여넣기 하지 않아도 목록/상세 정보를 자동으로 가져와 저장할 수 있습니다.
규칙 설정이 다소 복잡할 수 있으나,
html 구조를 기반으로 하기때문에 익숙해지면 어렵지 않을것같습니다.

스크래퍼는 부가기능에서 RP로 제공 될 예정이며
현재 DB저장 테스트 까지 완료되었습니다.





규칙 기본예제
<div id="items">
    <ul class="items_list">
         <li><span class="title">아이템1 입니다.</span></li>
         <li><span class="price">10,000원.</span></li>
    </ul>

    <ul class="items_list">
        <li><span class="title">아이템2 입니다.</span></li>
        <li><span class="price">20,000원.</span></li>
    </ul>
</div>

가져올 대상이 위와같은 html 구조이고 "금액" 을 가져오고 싶은 경우
ul.items_list/li[2]/span.price 형태로 작성하면 됩니다.
해석 : ul class="items_list" > 두번째 li > span class="price" > 안에 데이터를 가져와!

HTML을 복붙하면 자동으로 규칙을 만들어주는 부분도 개발중에 있습니다.





스크래퍼가 하는 일 
목록 페이지 수집 지정한 목록 URL에서 게시물(또는 상품) 목록을 읽어옵니다. 
한 페이지뿐 아니라 페이지 수(PAGE 1~N)를 설정해 여러 페이지를 연속 수집할 수 있습니다.

필드 추출(규칙 적용)

관리자에서 설정한 “필드 규칙”에 따라 아래 항목들을 원하는 형태로 뽑아냅니다.

제목, 가격, 작성자/판매처, 카테고리, 썸네일 이미지, 링크 URL 등

텍스트/속성(attr)/정규식 처리/숫자만 추출/URL 디코딩 등 후처리 가능


중복 방지(중복키 기반) 
데이터 마다 고유한 값(예: 글번호/상품ID/링크ID)을 “중복키(dedupe key)”로 설정할 수 있습니다. 
중복키가 이미 저장된 데이터면 스킵하거나, 옵션에 따라 업데이트 할 수 있습니다.

저장(게시판/DB) 
수집한 데이터를 게시판 컬럼(wr_subject, wr_content, wr_10 등) 에 저장합니다. 
이미지를 서버에 저장하거나 URL만 저장할 수 있습니다.

분류(카테고리) 매칭
외부 사이트의 카테고리 텍스트를 내 사이트 카테고리명(ca_name)으로 변환해 저장할 수 있습니다.

상세페이지 수집
기본은 “목록”만 수집하지만, 옵션을 켜면 목록에서 추출한 링크로 
상세페이지 까지 들어가서 내용을 추가로 가져올 수 있습니다. 

실행 방식 
관리자모드의 “스크래핑 목록”에서 [실행] 버튼을 눌러 즉시 실행할 수 있습니다. 
데이터가 많거나 주기적으로 수집해야 하는 경우 크론(CRON) 실행을 지원 합니다.


Uploaded Image


Uploaded Image

Uploaded Image
  • 공유링크 복사
  • profile_image
    리빌더미니홈 1:1 대화하기 @master 구독 40명
  • 그누보드 리빌더는, 그누보드의 기능을 모두 그대로 사용하면서 폴더의 추가만으로 손쉽게 웹사이트를 완성하고 다양한 편의기능을 사용할 수 있습니다. 고도화는 계속 진행됩니다.
    미니홈 쪽지 구독하기
    구독하고 알림받기

    댓글목록

    profile_image
    bank365미니홈 1:1 대화하기  오래 전

    엄청 유용한 시스템 입니다.
    근데 제겐 너무 어렵네요 ㅠㅠ

    2026-01-02 05:49

    profile_image
    리빌더미니홈 1:1 대화하기  오래 전

    쉽게 쓰실 수 있도록 가이드를 준비해보겠습니다.
    감사합니다!

    2026-01-02 14:05

    profile_image
    no_profile rainbow미니홈 1:1 대화하기  오래 전

    새해 선물이네요.
    감사합니다. ^^~
    새해 복 많이 받으시고, 항상 건강하세요.

    2026-01-02 07:23

    profile_image
    리빌더미니홈 1:1 대화하기  오래 전

    항상 고맙습니다. 새해 복 많이 받으세요!

    2026-01-02 14:05

    profile_image
    no_profile 하루알바미니홈 1:1 대화하기  오래 전

    유튜브 api를 이용해서 유튜브 채널의 영상도 가져오는 기능도 있으면 더 좋을거같습니다

    2026-01-02 08:00

    profile_image
    리빌더미니홈 1:1 대화하기  오래 전

    좋은의견 고맙습니다.
    준비해보겠습니다.

    2026-01-02 14:06

    profile_image
    미키손미니홈 1:1 대화하기  오래 전

    신기술 환영합니다
    새해 복 많이 받으시고, 번창하세요^^

    2026-01-02 09:17

    profile_image
    리빌더미니홈 1:1 대화하기  오래 전

    항상 고맙습니다.
    새해 복 많이받으세요!

    2026-01-02 14:06

    profile_image
    no_profile 민트다이어리미니홈 1:1 대화하기  오래 전

    네이버블로그나 인스타그램, 페이스북 같은 SNS도 가능하면 좋겠습니다. ^^

    2026-01-02 09:29

    profile_image
    리빌더미니홈 1:1 대화하기  오래 전

    블로그도 html 이니 구조만 넣으면 작동을 할것같습니다.
    블로그나 SNS쪽도 테스트 해보겠습니다.

    2026-01-02 14:07

    profile_image
    no_profile decoy미니홈 1:1 대화하기  오래 전

    와따네요~
    필요한 기능이었습니다.

    2026-01-02 12:21

    profile_image
    리빌더미니홈 1:1 대화하기  오래 전

    항상 감사합니다.
    조금 더 다듬어서 배포해드리겠습니다.
    새해 복 많이받으세요!

    2026-01-02 14:07

    profile_image
    no_profile 민호민호미니홈 1:1 대화하기  오래 전

    이거 완전 추천합니다
    수고 많으셨습니다 ^____^
    소핑몰쪽으로 초기 상품 등록이 힘들어서 개인적으로 만들어서 사용중인데 완전 편해요
    저는 개인용으로 작성해서 특정업체에 맞게 해놓았는데 범용으로 해주시고 관리자  설정 기능까지
    제꺼와 비교하면 완전 고급형이네요
    뱊되면 사용후 피드백 드리겠습니다

    저는 귀찮아서 상품 옵션은 안했는데 쇼핑몰 상품의 옵선도 스크래퍼 가능한가요?

    2026-01-03 02:10

    profile_image
    리빌더미니홈 1:1 대화하기  오래 전

    옵션은 영카트 설정의 복잡도 때문에 어려울것같습니다!
    양해 부탁드립니다.

    2026-01-03 02:40

    profile_image
    no_profile 민호민호미니홈 1:1 대화하기  27일 전

    매핑 항목이 첨부파일 2개이상 또는 링크 2개이상 같은 동적 DB필드들도 있는데 추출 규칙에 따라 여러개가 추출될수있는 첨부파일, 링크처럼 배열로 추출도 가능한지요?

    게시물마다 동적 첨부파일 또는 동적 링크 수량이 다를수 있어서 낱개로 하는것은 의미가 없어보이고 배열 형식의 추출값도  사용할수있는 방법이 있엇으면 좋겠습니다

    2026-01-04 02:22

    profile_image
    bank365미니홈 1:1 대화하기  22일 전

    아쉽지만 해당기능은 법률적 이슈가 있는것으로 확인 되었습니다.
    법률 검토를 좀 더 거친 후에 공개여부를 결정 하는것이 좋을것같습니다.

    ==============
    아쉽네요 ㅠㅠ
    법률 검토 잘하셔서 출시 / 미출시 결정되었으면 좋겠습니다

    2026-01-08 18:36