mendableai · txrp0x9 · Oct 27, 2024 · nickscamara · Oct 28, 2024 · nickscamara
diff --git a/apps/api/src/scraper/WebScraper/single_url.ts b/apps/api/src/scraper/WebScraper/single_url.ts
@@ -447,7 +447,7 @@ export async function scrapSingleUrl(
     let linksOnPage: string[] | undefined;
 
     if (pageOptions.includeLinks) {
-      linksOnPage = extractLinks(rawHtml, urlToScrap);
+      linksOnPage = extractLinks(html, urlToScrap);
 crawler.extractLinksFromHTML(rawHtml ?? "", sc.originUrl), 
 links.push(...this.extractLinksFromHTML(content, url).map(url => ({ url, html: content, pageStatusCode, pageError }))); 
 public extractLinksFromHTML(html: string, url: string) { 
   let links: string[] = []; 
   const $ = load(html); 
   $("a").each((_, element) => { 
     const href = $(element).attr("href"); 
     if (href) { 
       const u = this.filterURL(href, url); 
       if (u !== null) { 
         links.push(u); 
       } 
     } 
   }); 
   return links; 
 } 
 crawler.extractLinksFromHTML(rawHtml ?? "", sc.originUrl), 
 links.push(...this.extractLinksFromHTML(content, url).map(url => ({ url, html: content, pageStatusCode, pageError }))); 
 public extractLinksFromHTML(html: string, url: string) { 
   let links: string[] = []; 
  
   const $ = load(html); 
   $("a").each((_, element) => { 
     const href = $(element).attr("href"); 
     if (href) { 
       const u = this.filterURL(href, url); 
       if (u !== null) { 
         links.push(u); 
       } 
     } 
   }); 
  
   return links; 
 } 
     }
 
     let document: Document = {