HTML

[HTML] 태그 제거하고 텍스트 추출하기

돌맹이떼굴떼굴 2024. 10. 28. 10:25

1. 문제점

엄청나게 많은 테그에 있는 텍스트만 추출하고 싶은데 쉽지 않다. 따라서 간단하게 추출할 수 있는 방법을 알아보았다.

 

 

2. 문제 해결

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Document</title>
</head>
<body>
    // 요기에 추출할 모든 거 넣기
</body>
<script>
// body 내의 모든 텍스트를 추출
const bodyText = document.body.textContent;
console.log(bodyText);
</script>
</html>

<body> 태그 안에 다 때려넣고 라이브 서버 실행하면 브라우저 console에 텍스트만 남는다.

 

요렇게 나오고 텍스트 정리하자.