RadarURL
Skip to content
조회 수 1759 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

로봇배제 표준이란?
구글등 검색 로봇이 정보수집을 위해 사이트를 방문할 경우를 대비하여, 검색로봇에 대한 웹사이트의 디렉토리 및 파일 들에 대한 검색조건을 명시해 놓은 국제 규약이다.

• 정상적인 검색로봇은 사이트 방문시 가장 먼저 웹사이트의 로봇배제 표준파일(robots.txt)를 확인하고, 파일에 명시된 사항을 준수하면서 웹사이트의 컨텐츠를 수집한다.
• robots.txt 화일에는 최소한 한개의 Disallow 필드(field)가 있어야 한다.

로봇 배제 표준은 방지기술이 아닌 사이트 및 검색로봇 운영자간의 단순한 약속(규약)이므로 악의적인 로봇이 로봇 배제 표준을 무시하고 사이트의 컨텐츠를 수집할 수 도 있다.

robots.txt의 내용은 다음과 같은 의미로 사용된다.

User-agent: *은 모든 User-agent이고,
특정 user-agent를 지정할 경우 해당 로봇 이름을 지정
Allow or Disallow: disallow에서
/은 모든 하위 문서에 대해 배재를 의미하고,
아무것도 지정하지 않으면 허가를 의미

/arirang/는 arirang 디렉토리만,
/arirang은 arirang 디렉토리와 그 디렉토리내의 파일이 적용대상임

노출 허용/금지 의도 robots.txt 타이틀 robots.txt 내용
홈페이지 전체 내용을 모든 검색엔진에 노출을 허용 User-agent: *
Disallow:
홈페이지 전체 내용을 모든 검색엔진에 노출을 방지 User-agent: *
Disallow: /
홈페이지 디렉토리가 information인 것에 대한 노출을 방지 User-agent: *
Disallow: /information/
특정 검색엔진(abcbot)의 접근만을 거부 User-agent: abcbot
Disallow: /
User-agent: *
Disallow:
특정 검색엔진(abcbot)의 접근만을 허용 User-agent: abcbot
Disallow:
User-agent: *
Disallow: /
모든 검색엔젠에 대해 /directory/a.html의 접근을 거부 User-agent: *
Disallow: /directory/a.html
홈페이지의 디렉토리가 information인 것에 대한 노출을 허가 User-agent: *
Disallow: /information/
홈페이지의 디렉토리 또는 파일명이 information인 것에 대한 접근을 허가 User-agent: *
Disallow: /information

【예제】
# pwd
/export/home/apache2/htdocs
# ls
favicon.ico     index.html      left.html       right.html      sounds
images          lecture         netsarang.html  robots.txt
# cat robots.txt
user-agent:*
disallow:
#


http://www.robotstxt.org/ 참조

 

출처 : http://radiocom.kunsan.ac.kr/lecture/home_page/robots_txt.html

?

List of Articles
번호 제목 글쓴이 날짜 조회 수
71 .htaccess JaeSoo 2009.06.24 4322
70 .htaccess 를 이용한 이미지 핫링크 예방법 JaeSoo 2012.03.07 2630
69 .htaccess 사용해서 이미지 외부링크 막기 JaeSoo 2012.03.07 2919
68 Apache 서버에서 확장자 .htm 파일 내의 php 코드가 실행되지 않는 문제 해결 방법 JAESOO 2014.05.26 1692
67 Apache 2.0 에서 여러 도메인에 SSL 인증서 적용하기 JaeSoo 2013.03.01 3150
66 Apache eating up 100% of cpu load with only 12req/s (아파치 웹서버가 CPU 점유율 100%가 될때) JaeSoo 2013.03.08 4577
65 apache httpd.conf 설정 및 설명 JaeSoo 2012.09.09 1549
64 Apache Redirect 설정 팁 - http또는 https로 접속 시 www를 항상 자동으로 붙히기 JaeSoo 2013.02.28 4238
63 Apache rewrite 사용 방법 - 특정 URL이 입력되면 다른 URL로 연결 JaeSoo 2013.04.08 4625
62 Apache Struts 버전 확인 방법 JAESOO 2014.05.09 2166
61 Apache 버전 확인방법 JaeSoo 2013.02.20 1263
60 Apache 실행환경을 nobody 사용자로 변경 JAESOO 2014.05.28 1508
59 Apache2 openssl on Winows XP (https 접속) JaeSoo 2013.03.01 3644
58 Apache: A good Webalizer.conf for the Webalizer Apache Log Analyzer utility JAESOO 2014.12.22 1236
57 Apache에서 .htaccess 파일 활용하기 - Rewrite mod JaeSoo 2009.05.12 3819
56 Apache에서 mod_expires를 이용한 이미지 캐싱 처리 JaeSoo 2012.08.29 2402
55 apache용 ewrite rule (htaccess)을 nginx rewrite rule로 변환 JaeSoo 2013.04.06 3785
54 apache의 httpd.conf 설정 팁 JaeSoo 2012.09.09 1623
53 APMSETUP + JSP 2 JaeSoo 2012.04.13 6125
52 APMSETUP 7 + eAccelerator 설치.. JaeSoo 2011.05.21 9518
Board Pagination Prev 1 2 3 4 Next
/ 4

PageViews   Today : 5155 Yesterday : 5037 Total : 21961207  /  Counter Status   Today : 5009 Yesterday : 4602 Total : 1187732

Edited by JAESOO

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소