1 year ago · 2e8ee0c986
--- a/apps/app/src/server/service/page-spritter.ts
+++ b/apps/app/src/server/service/page-spritter.ts
@@ -27,7 +27,10 @@ export async function splitMarkdownByTokens(
 
				 ): Promise<string[]> {
			
 
				   // Obtain encoding based on the model
			
 
				   const encoding: Tiktoken = encoding_for_model(model);
			
 
				-  const remarkParse = (await import('remark-parse')).default;
			
 
				+
			
 
				+  // Dynamically import remark-parse
			
 
				+  const { default: remarkParse } = await import('remark-parse');
			
 
				+
			
 
				   // Parse Markdown into AST
			
 
				   const processor = unified().use(remarkParse);
			
 
				   const tree = processor.parse(markdownContent) as Root;
			
--- a/apps/app/test/integration/service/page-sprit.test.ts
+++ b/apps/app/test/integration/service/page-sprit.test.ts
@@ -1,3 +1,5 @@
 
				+// test/integration/service/page-spritter.test.ts
			
 
				+
			
 
				 import type { TiktokenModel } from '@dqbd/tiktoken';
			
 
				 
			
 
				 import { splitMarkdownByTokens } from '../../../src/server/service/page-spritter';
			
@@ -5,14 +7,14 @@ import { splitMarkdownByTokens } from '../../../src/server/service/page-spritter
 
				 describe('splitMarkdownByTokens', () => {
			
 
				   const model: TiktokenModel = 'gpt-3.5-turbo';
			
 
				 
			
 
				-  test('Returns without splitting when token count is below the maximum', () => {
			
 
				+  test('Returns without splitting when token count is below the maximum', async() => {
			
 
				     const markdownContent = '# Heading\n\nThis is a test.';
			
 
				-    const result = splitMarkdownByTokens(model, markdownContent, 1000);
			
 
				+    const result = await splitMarkdownByTokens(model, markdownContent, 1000);
			
 
				     expect(result).toHaveLength(1);
			
 
				     expect(result[0]).toBe(markdownContent);
			
 
				   });
			
 
				 
			
 
				-  test('Splits by sections when token count exceeds the maximum', () => {
			
 
				+  test('Splits by sections when token count exceeds the maximum', async() => {
			
 
				     const markdownContent = `
			
 
				 # Heading1
			
 
				 
			
@@ -26,14 +28,14 @@ This is the content of section 2.
 
				 
			
 
				 This is the content of section 3.
			
 
				     `;
			
 
				-    const result = splitMarkdownByTokens(model, markdownContent, 10); // Set a small maxTokens
			
 
				+    const result = await splitMarkdownByTokens(model, markdownContent, 10); // Set a small maxTokens
			
 
				     expect(result).toHaveLength(3);
			
 
				     expect(result[0]).toContain('Heading1');
			
 
				     expect(result[1]).toContain('Heading2');
			
 
				     expect(result[2]).toContain('Heading3');
			
 
				   });
			
 
				 
			
 
				-  test('Recursively splits into subsections', () => {
			
 
				+  test('Recursively splits into subsections', async() => {
			
 
				     const markdownContent = `
			
 
				 # Heading1
			
 
				 
			
@@ -49,29 +51,29 @@ Content1-2
 
				 
			
 
				 Content2
			
 
				     `;
			
 
				-    const result = splitMarkdownByTokens(model, markdownContent, 20);
			
 
				+    const result = await splitMarkdownByTokens(model, markdownContent, 20);
			
 
				     expect(result.length).toBeGreaterThan(2);
			
 
				     expect(result.some(chunk => chunk.includes('Subheading1-1'))).toBe(true);
			
 
				     expect(result.some(chunk => chunk.includes('Subheading1-2'))).toBe(true);
			
 
				   });
			
 
				 
			
 
				-  test('Splits by paragraphs', () => {
			
 
				+  test('Splits by paragraphs', async() => {
			
 
				     const markdownContent = `
			
 
				 # Heading
			
 
				 
			
 
				 ${'Long paragraph. '.repeat(50)}
			
 
				     `;
			
 
				-    const result = splitMarkdownByTokens(model, markdownContent, 50);
			
 
				+    const result = await splitMarkdownByTokens(model, markdownContent, 50);
			
 
				     expect(result.length).toBeGreaterThan(1);
			
 
				   });
			
 
				 
			
 
				-  test('Adds a single node as is when it exceeds maxTokens', () => {
			
 
				+  test('Adds a single node as is when it exceeds maxTokens', async() => {
			
 
				     const markdownContent = `
			
 
				 # Heading
			
 
				 
			
 
				 ${'Very long paragraph. '.repeat(200)}
			
 
				     `;
			
 
				-    const result = splitMarkdownByTokens(model, markdownContent, 50);
			
 
				+    const result = await splitMarkdownByTokens(model, markdownContent, 50);
			
 
				     expect(result).toHaveLength(1);
			
 
				     expect(result[0]).toContain('Very long paragraph.');
			
 
				   });