Pages

Thursday, October 31, 2013

XMLlucination: 의사(pseudo) XML 해석기

XMLlucination은 XML 문서에 대한 의사(pseudo) 해석기입니다. XMLlucination은 노드를 찾고, 속성이나 노드 안의 raw text를 읽을 수 있습니다. 예. raw text입니다 - 텍스트 엘리먼트같은 것만 선택적으로 뽑아내는게 아니라, 노드 안에 있는 텍스트 전체를 뽑아내는 무식한 녀석입니다(……).

이 코드의 라이선스는 Lazarus의 라이선스 조건을 따릅니다. 기본적으로는 LGPL이나, 추가적으로 static link를 허용합니다.

간단한 사용법은 다음과 같습니다:

  1. 파일을 PChar 배열이나 String에 읽어들입니다.
  2. LocateNodePair()를 사용하여 TNodePair를 받습니다.
  3. GetAttributeValue()에 TNodePair.Open를 적용하여 속성값을 얻어냅니다.
  4. GetNodeValue()에 TNodePair 객체를 적용하면 node 안의 text를 얻을 수 있습니다.

아무쪼록 도움이 되셨으면 좋겠습니다. 즐거운 코딩 되세요!

2014년 4월 21일 추가:2013년 10월 31일에 등록된 원본 포스팅에서는 본 포스팅에 모든 소스코드를 공개하였으나,지금은 소스코드를 Google Drive의 파일 링크로 대체합니다. Uploading 당시 Tumblr의 오류로 추정되는 이상행위로 인해 소스코드가 여러모로 사용 불가능하게 등록되어 있더군요(따옴표의 유니코드 대체, ‘보다 작다’ 부등호 사인의 삭제 등).
이 문장을 클릭하시면 파일을 다운로드하실 수 있습니다.

XMLlucination: XML pseudo-parser

XMLlucination is a pseudo-parser for XML documents, in which you can locate nodes and read attributes or raw text between nodes. Yes. It is raw text - anything between nodes, not intelligently extract text elements only. :P

This code applies the same license terms of Lazarus, LGPL with additionally accepting static link.

Quick start guide:

  1. Load a file to array of PChar or String
  2. Use LocateNodePair() to get a TNodePair
  3. Use GetAttributeValue() with TNodePair.Open to search for a attribute value
  4. Use GetNodeValue() with TNodePair object
Hope you like it. Happy coding!

Edit at April 21th. 2014:In the original posting at Oct. 31. 2013, I opened the full source code here but now I replace the code with download link to Google Drive. I found out the source code is broken, which is expected to unexpected Tumblr behavior(replacing the quotation mark to unicode characters, deleting ‘less than’ sign accidentally, etc).

Click here to download the file.

Monday, October 14, 2013

Freepascal과 Lazarus를 위한 자작 Boyer-Moore-Horspool 문자열 검색 알고리 즘

아래의 코드는 Boyer-Moore-Horspool 문자열 검색 알고리즘을 직접 Freepascal / Lazarus로 구현한 코드입니다. Freepascal / Lazarus에서만 테스트되었습니다만, 델파이에서도 충분히 사용 가능하리라고 생각됩니다.

이 코드의 라이선스는 Lazarus가 채용한, 수정된 LGPL(LGPL+static link 허용)을 따릅니다. 사용하시는데 큰 문제는 없을겁니다.

간단한 사용법은 다음과 같습니다.

  1. TPosBMH 객체를 생성합니다
  2. TPosBMH.PosBMH()를 호출하면 첫번째 위치를 찾습니다
  3. TPosBMH.PosBMHNext()를 호출하면 다음 위치를 찾습니다
  4. 만일 찾는 대상이 더이상 없다면, TPosBMH는 Nil을 반환합니다
실제 코드는 다음과 같습니다. 도움이 되셨으면 좋겠습니다.

{
Unit PosBMH: Implementation of Boyer-Moor-Horpspool string search algorithm, optimized for consecutive searches

Create a TPosBMH object, use PosBMH() for initializing search, and PosBMHNext() for consecutive search. The return value is always PChar.

Can be used freely under the same license of LCL(Lazarus Component Library), which adopts modified LGPL.
(LGPL + allowing exception for static linking)

©Copyright 2012~2013 Robert Teminian(Hyunse Oh)
}
unit PosBMH;

{$mode objfpc}{$H+}

interface

uses
Classes, SysUtils;

type
TPosBMH = class(TObject)
private
FBMHLast: PChar;
FSubString: String;
FSubStringLength: SizeInt;
FBMHSkipTable: Array[0..255] of SizeInt;
procedure FBuildSkipTable();
procedure FPosBMH();
protected
BMHCursor: PChar;
public
function PosBMH(Needle: String; StartAt: PChar; EndAt: PChar): PChar;
function PosBMH(Needle: String; var Haystack: String): PChar;
function PosBMHNext: PChar;
end;

implementation

procedure TPosBMH.FBuildSkipTable();
var
i: Integer;
begin
for i:=0 to 255 do FBMHSkipTable[i]:=FSubStringLength;
for i:=1 to FSubStringLength do FBMHSkipTable[Byte(FSubString[i])]:=FSubStringLength-i;
end;

procedure TPosBMH.FPosBMH();
begin
while BMHCursor if FBMHSkipTable[Byte(BMHCursor^)]=0 then begin
Dec(BMHCursor, FSubStringLength-1);
if CompareByte(BMHCursor^, FSubString[1], FSubStringLength)=0 then Exit
else Inc(BMHCursor, FSubStringLength);
end else Inc(BMHCursor, FBMHSkipTable[Byte(BMHCursor^)]);
end;
BMHCursor:=nil;
end;

function TPosBMH.PosBMH(Needle: String; StartAt: PChar; EndAt: PChar): PChar;
begin
FSubString:=Needle;
FSubStringLength:=Length(FSubString);
BMHCursor:=StartAt;
FBMHLast:=EndAt;
FBuildSkipTable();
FPosBMH();
Result:=BMHCursor;
end;

function TPosBMH.PosBMH(Needle: String; var Haystack: String): PChar;
begin
Result:=PosBMH(Needle, @Haystack[1], @Haystack[Length(Haystack)]);
end;

function TPosBMH.PosBMHNext: PChar;
begin
if(BMHCursorNil) then begin
Inc(BMHCursor, FSubStringLength);
FPosBMH();
end;
Result:=BMHCursor;
end;

end.

Implementation of Boyer-Moore-Horspool string search algorithm forFreepascal / Lazarus

This is my own implementation of Boyer-Moore-Horspool string search algorithm for object pascal. Though tested only in Freepascal / Lazarus, I think the code can also apply to Delphi.

The license of this code is modified LGPL Lazarus adopted(LGPL+permitting static link), so enjoy using it,

Quick instructions:

  1. Make a TPosBMH object
  2. Use TPosBMH.PosBMH() to find out the first occurrence
  3. Use TPosBMH.PosBMHNext() to locate the next occurrence
  4. If there’s no more, TPosBMH returns Nil
Now, here comes the code. Enjoy!

{
Unit PosBMH: Implementation of Boyer-Moor-Horpspool string search algorithm, optimized for consecutive searches

Create a TPosBMH object, use PosBMH() for initializing search, and PosBMHNext() for consecutive search. The return value is always PChar.

Can be used freely under the same license of LCL(Lazarus Component Library), which adopts modified LGPL.
(LGPL + allowing exception for static linking)

©Copyright 2012~2013 Robert Teminian(Hyunse Oh)
}
unit PosBMH;

{$mode objfpc}{$H+}

interface

uses
Classes, SysUtils;

type
TPosBMH = class(TObject)
private
FBMHLast: PChar;
FSubString: String;
FSubStringLength: SizeInt;
FBMHSkipTable: Array[0..255] of SizeInt;
procedure FBuildSkipTable();
procedure FPosBMH();
protected
BMHCursor: PChar;
public
function PosBMH(Needle: String; StartAt: PChar; EndAt: PChar): PChar;
function PosBMH(Needle: String; var Haystack: String): PChar;
function PosBMHNext: PChar;
end;

implementation

procedure TPosBMH.FBuildSkipTable();
var
i: Integer;
begin
for i:=0 to 255 do FBMHSkipTable[i]:=FSubStringLength;
for i:=1 to FSubStringLength do FBMHSkipTable[Byte(FSubString[i])]:=FSubStringLength-i;
end;

procedure TPosBMH.FPosBMH();
begin
while BMHCursor if FBMHSkipTable[Byte(BMHCursor^)]=0 then begin
Dec(BMHCursor, FSubStringLength-1);
if CompareByte(BMHCursor^, FSubString[1], FSubStringLength)=0 then Exit
else Inc(BMHCursor, FSubStringLength);
end else Inc(BMHCursor, FBMHSkipTable[Byte(BMHCursor^)]);
end;
BMHCursor:=nil;
end;

function TPosBMH.PosBMH(Needle: String; StartAt: PChar; EndAt: PChar): PChar;
begin
FSubString:=Needle;
FSubStringLength:=Length(FSubString);
BMHCursor:=StartAt;
FBMHLast:=EndAt;
FBuildSkipTable();
FPosBMH();
Result:=BMHCursor;
end;

function TPosBMH.PosBMH(Needle: String; var Haystack: String): PChar;
begin
Result:=PosBMH(Needle, @Haystack[1], @Haystack[Length(Haystack)]);
end;

function TPosBMH.PosBMHNext: PChar;
begin
if(BMHCursorNil) then begin
Inc(BMHCursor, FSubStringLength);
FPosBMH();
end;
Result:=BMHCursor;
end;

end.