js 正则过滤域名 万能方法

之前写的一个爬虫,目标站的文章里面随机插入域名关键字来防采集

下面给大家贴一段通用的过滤域名的方法

 

//全角转半角
const toHalf = function(str) { 
  var tmp = ""; 
  for(var i=0;i<str.length;i++){ 
      if (str.charCodeAt(i) == 12288){ 
          tmp += String.fromCharCode(str.charCodeAt(i)-12256); 
          continue; 
      } 
      if(str.charCodeAt(i) > 65280 && str.charCodeAt(i) < 65375){ 
          tmp += String.fromCharCode(str.charCodeAt(i)-65248); 
      } 
      else{ 
          tmp += String.fromCharCode(str.charCodeAt(i)); 
      } 
  } 
  return tmp 
} 

let str = toHalf(str)
str = str.toLowerCase() //统一转成小写
let reg = /[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?/g  //域名匹配 通用正则
console.log(str.replace(reg, '替换成自己的值')) 
KK资源网分享最优质的的资源,涵盖网站建设、IT技术、主题源码
KK资源吧 » js 正则过滤域名 万能方法

发表评论