.
블로그 로고

B급 코드 리뷰

책과 IT뉴스에 대한 B급 감성 리뷰로 디지탈노마드 세상에 다가간다.
블로그"B급 코드 리뷰"에 대한 검색결과315건
  • [비공개] 네이버 쇼핑 크롤링 - 핵심 상품정보 추출하기

    웹 크롤로를 통해 네이버 쇼핑 상품을 검색하고 상품의 핵심정보를 추출해 보자. chatgpt 제휴마케팅을 위한 유용한 정보로 사용할 수 있다.  방법은 앞서 포스팅한 셀레니움을 이용해 상세정보를 추출한다. 간단한 방법으로 정보를 가져올 수 있지만, 오늘 된다고 내일 된다는 보장은 없다. 네이버에서 크롤링 정보 추출을 자주 막기 때문이다.  지난번에 네이버 쇼핑 정보를 가져오는 코드를 작성했는데, 오늘 해보니 페이지 없음 에러가 나타났다. 네이버에서 조치를 취한 것이다. 처음엔 헤더 정보를 수정해 봤지만 소용이 없었다. 페이지를 한번 우회해 접속하는 방법으로 해결을 하였다.  url = f"https://search.shopping.naver.com/search/all?query={keyword}" driver.get("https://www.naver.com/") time.sleep(3) driver.get(url) 자! 본견적으로 chatgpt에 던져줄 상품 정보를 추출해 보자..
    B급 코드 리뷰|2024-04-06 06:09 pm|추천

    추천

  • [비공개] chatgpt 실전 프롬프트 만들기 2 - 이거 빠지면 누더기 글된다.

    지난 chatgpt 실전 프롬프트 만들기 1편에 이어 좀 더 놀라운 결과물을 보게 될 것이다. 인공지능 글쓰기가 더 이상 의미 없는 포스팅 글, 재미없고 인공적인 글만 쓰는 게 아니라, 실제 목적을 가진 설득력 있는 글이란 느낌을 받게 된다. 이 포스팅을 끝까지 보라.   1. 역할 부여하기 바로 xx주제로 포스팅용 글쓰기 해달라고 하지 말자. 누더기글이 나올 확률이 높다. chatgpt에게 역할을 부여한다. 명확하게 말이다.  IT 제품 블로그라면,  chatgpt가 10년된 IT 전문 블로그로 빙의한다. 한결 전문성과 검색에 최적화된 seo 글을 작성해 줄 확률이 높아진다.  2. 제품 비교 프롬프트 작성하기  2개 제품 이름과 스펙을 기술한다. 네이버 쇼핑을 참고했다. 동일한 제품 속성을 넣어 줘야 비교하기 좋고 구매자에게 도움이 되는 글이 될 것이다.  키워드도 넣어준..
    B급 코드 리뷰|2024-04-04 11:55 pm|추천

    추천

  • [비공개] chatgpt 실전 프롬프트 만들기 1

    chatgpt에 제대로 주문을 하지 않으면 엉뚱한 결과가 나오거나 뻔한 답변이 나온다. 제대로 된 역할과 상세한 요구사항을 알려줘야 원하는 답을 얻을 확률이 높아진다.  쇼핑몰 제휴 마케팅을 한다고 하면, 제목 추출부터 본문 작성이 쉽지 않을테다. 어떻게 chatgpt에 요청해야 될까? 아래 상품을 판매하고자 한다면, 일단 상품명과 스펙들을 모아보자.    이 정보를 chatgpt에 요청해 포스팅 제목을 요청하자.  삼성전자 2021 노트북 플러스2 15.6 출시년월 : 2021년 5월 CPU 모델 번호: 7505 GPU 모델명: 인텔 UHD 그래픽스 화면크기: 39.6cm 화면크기(인치): 15.6인치 CPU 기본속도: 2GHz 크기 : 359.2 x 241.3 x 18.8 mm 무게 : 1.81kg 주요 사양 : CPU 팬티엄 / 메모리 추가 교체장착 가능 / SSD 2.5인치 추가 장착가능 최저 : 609,000원 -------- 위 내용으로 블..
    B급 코드 리뷰|2024-04-04 12:36 am|추천

    추천

  • [비공개] Telegram API 이용해 네이버 기사를 보여주는 게 가능해?

    Telegram은 코인 정보 수집할 때 자주 들락거렸는데, 한동안 뜸했다. 최근 불장 바람에 다시 들어가 봤더니 수많은 채팅방들이 정보를 쏟아내고 있었다. 나만의 정보 제공방도 만들어 보면 재밌겠다. Telegram에서 제공하는 API를 이용해 메시지를 던지면 된다. 간단한 인사부터 뉴스 기사 정보 등 다양하게 제공할 수 있다.  1. Telegram API 등록하기 (1) Telegram에서 BotFather 검색한다. 짝퉁이 많으니 공식인지 확인한다. (파란색 둥근 체크박스) (2) 나만의 bot을 만든다. /newbot 입력하면 나의 bot을 만들 수 있다.  (3) bot 이름과 username을 입력한다. username은 'bot'으로 끝나야 하고 중복을 체크한다.  (4) Telegram API 확인 : HTTP API 확인하고 카피한다.  (5) 나의 Bot 채팅방도 만들어졌다.  (6) 채팅방에 접속하자 빈방이라 아무것도 없다. 메시지 입력하면 채팅..
    B급 코드 리뷰|2024-03-30 10:12 pm|추천

    추천

  • [비공개] 웹 크롤링 실전 - 쿠팡 상세 페이지 정보 가져오기

    지난 쿠팡 상품 리스트 추출에 이어 상세 페이지 정보도 한꺼번에 출력해 보자.  2024.03.28 - [코드리뷰/chatGPT(Python)코드] - 웹 크롤링 실전 - 쿠팡 상품 정보 가져오기   웹 크롤링 실전 - 쿠팡 상품 정보 가져오기 본견적으로 쿠팡 상품 정보를 수집해 보자. 1. 키워드 검색 keyword = input("KEYWORD : ") url = f"https://www.coupang.com/np/search?component=&q={keyword}" 2. 쿠팡 검색 결과 화면 분석하기 크롤링 결과를 잘 활용하기 iamgus.tistory.com 1. 쿠팡 상품 페이지 리스트 정의하기 상세 페이지 url을 담을 리스트 정의 하고 담기 link_list = [] for rank, item in enumerate(items[:10],1):     name = item.select_one(".name")     price = item.select_one(".price-value")     link = f"https://www.coupang.com{item.a['href']}"     image = item.select_one(".search-product-wrap-img")             print(name.text.strip())         if pric..
    B급 코드 리뷰|2024-03-29 08:57 pm|추천

    추천

  • [비공개] 웹 크롤링 실전 - 쿠팡 상품 정보 가져오기

    본견적으로 쿠팡 상품 정보를 수집해 보자.    1. 키워드 검색 keyword = input("KEYWORD : ") url = f"https://www.coupang.com/np/search?component=&q={keyword}" 2. 쿠팡 검색 결과 화면 분석하기 크롤링 결과를 잘 활용하기 위해선 화면 분석이 정말 중요하다. 수집해야 할 상품을 솎아내야 한다. 광고 상품이나 이벤트 상품을 걸러야 하는 것이다.  그러기 위해선 개발자 도구 분석이 필수적이다.  각 상품은 search-product 클래스에 정의된다. 이 하위에 모든 상품 정보를 포함한다.  3. 코드 작성하기 아래 코드 차이는 정확한 클래스명을 지정하는 것이다. 첫번째는 search-product 클래스 외 또 다른 클래스가 함께 있어도 찾아진다. 즉, 광고나 이벤트에 이 클래스가 이용된다는 말이다. 반면 두 번째는 search-product 클래스만 가진 태그에서 상품 정보를 추출한다.  # items = soup.select..
    B급 코드 리뷰|2024-03-28 10:48 pm|추천

    추천

  • [비공개] 웹 크롤링 실전 - 쿠팡 크롤링 안되면 이것만 넣어주면 됩니다.

    쿠팡 파트너스를 통한 제휴 수익을 가장 크게 기대할 수 있는 곳이 바로 쿠팡이다. 얼마나 많은 봇들이 유용한 데이터를 수집하려고 설쳐 되겠는가!  단순 크롤링 코드로는 쿠팡 사이트 접속이 안 될뿐더러 자칫 잘못하면 차단이 될 수도 있다. 주의할 점을 알아보고 가장 기본적인 크롤링을 통한 쿠팡 접속을 해보자.    1. robots.txt 확인 https://www.coupang.com/robots.txt 이 페이지는  외부에서 쿠팡 접속 시 허용하는 것과 아닌 것을 알려준다. 구글과 네이버 외에 다른 aget를 통한 접속은 허용하지 않는다. 다만 강제성은 없고 information이다. 사이트에 영향을 준다면 이 기준에 맞춰 문제를 일으키는 봇이나 프로그램을 차단할 수 있다는 경고이기도 하다.  원칙적으로는 금지하고 있지만, 실습이나 참고용으로 하려면 vpn이나 핫스팟으로 가변 ip주소를 이용하..
    B급 코드 리뷰|2024-03-26 09:12 pm|추천

    추천

  • [비공개] 웹 크롤링 기초 - 네이버 쇼핑몰 상품 정보 추출하기

    BeautifulSoup, Selenium을 이용해 네이버 쇼핑몰 상품 정보를 추출해 보자. requests는 처리속도는 좋지만 동적인 페이지 소싱이 어려워 Selenium을 이용한다.  네이버 상품 정보를 추출하는 연습만으로 웹 크롤링 이해하는 데 크게 도움이 될 것이다. 제대로 익히면 다른 사이트 데이터 추출 역시 식은 죽 먹는 것처럼 쉬워질 것이다.  1.네이버 쇼핑몰 화면 분석하자. 네이버 쇼핑몰에 노트북으로 검색한다. 상품 이미지, 상품명, 가격, 속성 등이 포함된 리스트가 나타난다.  https://search.shopping.naver.com/search/all?query=노트북 개발자 도구(F12)를 열어 데이터 추출할 키를 찾는다.  상품 리스트에 광고제품은 제외하자. class명이 광고와 일반상품을 구별하게 네이밍 되어있다. 친절하다. 2. 코드 작성하기 (1) 셀레니움 설정 from bs4 import BeautifulSoup from selenium import web..
    B급 코드 리뷰|2024-03-24 04:21 pm|추천

    추천

  • [비공개] 웹 크롤링 기초 - 셀레니움으로네이버 기사 제목 가져오기

    지난 포스팅에 requests를 이용해 네이버 기사를 크롤링했었다.  2024.03.22 - [코드리뷰/chatGPT(Python)코드] - 웹 크롤링 기초 - 네이버 기사 제목 가져오기   웹 크롤링 기초 - 네이버 기사 제목 가져오기 웹 크롤링을 이용해 간단하게 네이버 기사 제목을 뽑아보자. 웹 데이터 추출을 위해 select_one/select/find/find_all 메소드를 이용한다. 기초지만 크로링에서 가장 중요한 기능을 담당한다고해도 과언 iamgus.tistory.com requests는 빠르다는 장점은 있지만 동적인 데이터를 가져오는데 한계가 있다. 셀레니움을 이용하면 이런 문제가 해결된다. 수많은 기능이 내장되어 있어서 일일이 다 기술할 수는 없지만, 동적 페이지 구현 부분을 해보도록 하자.  1. 셀레니움 관련 By, Keys를 import 한다. 스크롤 다운과 같은 효과를 내기 위함이다. 페이지가 내려가면 자바스크립트가 ..
    B급 코드 리뷰|2024-03-23 06:29 pm|추천

    추천

  • [비공개] 웹 크롤링 기초 - selenium 네이버 접속하기

    동적인 웹 페이지, 즉 자바스크립트로 구성된 페이지는 일반적인(requests이용한) 크롤링을 통해 가져오기 어렵다. selenium이 등장하면서 간편하게 구현할 수 있게 되었다. selenium 기초 설정을 알아보자.  1. selenium 설치 : 별거없다. 아래 명령어 입력하고 엔터 치면 자동 설치된다.  pip install selenium 2. 코드 작성 from selenium import webdriver url = "https://naver.com" driver = webdriver.Chrome() driver.get(url) selenium을 통한 네이버 접속 소스다. 이보다 간단할 순 없다.  3. 코드 추가 (options 설정) Options을 설정한다.  (1) 프로그램 실행 시 웹 창을 최대화로 열기기 options.add_argument("--start-maximized") (2) 헤더정보 설정 - 윈도우 PC 헤더 : naver.com으로 실행된다. options.add_argument("User-Agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36") - 안드로이드 ..
    B급 코드 리뷰|2024-03-23 05:27 pm|추천

    추천

이전  1 2 3 4 5 ... 32  다음
셀로거는 비즈니스/마케팅 관련 블로그중 대중에게 RSS를 제공하는 블로그의 정보만 수집 및 정리하여 소개하는 비상업적 메타블로그 사이트입니다.
수집된 내용에 대한 모든 블로그의 저작권은 모두 해당 블로거에게 있으며 공개되는 내용에 대해서는 Sellogger의 입장과 무관합니다.
셀로거에서는 원글의 재편집 및 수정을 하지 않으며 원문링크를 제공하여 전문확인을 위해서는 저작권자의 블로그에서만 확인가능합니다.
Copyright (c) Sellogger. All rights reserved. 피드등록/삭제요청 help@sellogger.com