Nekromanti Partners sökes till nytt programmeringsprojekt - "semantisk" webbläsare

stenhöna

tellstory
Joined
5 Oct 2002
Messages
964
Location
Hamburg
Hej rollspel.nu! Jag letar efter partners till ett nytt kodprojekt. Jag vill göra en "semantisk" webbläsare, dvs. en webbläsare som visar alla menyer, alla artiklar, alla forum etc på ett och samma sätt, liknande Reader View i Firefox, men för fler typer av "objekt" än bara artiklar. Ett sådant projekt kommer kräva en del efterforskning om algoritmer och hur man parsar HTML för att rycka ut main content och annat, och att kunna anpassa dessa algoritmer för webbläsarens behov.
Projektpartner kan hjälpa till med allt möjligt - kodning, feedback, idéer, testning, läsning (av artiklar), eller pseudokod och GUI design.
Hör av dig om du är intresserad eller har fler frågor! Så kan vi starta ett repo på github för brainstorming. [IMG2=JSON]{"data-align":"none","data-size":"full","src":"https:\/\/static.xx.fbcdn.net\/images\/emoji.php\/v9\/t57\/1\/16\/1f609.png"}[/IMG2];)
Hälsningar
Olle
 

stenhöna

tellstory
Joined
5 Oct 2002
Messages
964
Location
Hamburg
olaberg;n332368 said:
Detta har jag både pysslat med och har en del kännedom om. Jag är på!
Shit, vad gött! Vad är din bakgrund? Jag jobbar med PHP och ekonomisk integration m.m., brukar köra OCaml för hobbyprojekt men funderar på om Java kunde passa för det här.
 

stenhöna

tellstory
Joined
5 Oct 2002
Messages
964
Location
Hamburg
olaberg;n332439 said:
Java, XML, SGML (skrev min första SGML-parser i C 1996) ...
Låter stabil! Jag skapar ett projekt på github. Har du en användare där?
 

stenhöna

tellstory
Joined
5 Oct 2002
Messages
964
Location
Hamburg
olaberg;n332439 said:
Java, XML, SGML (skrev min första SGML-parser i C 1996) ...
Ingen aning om du fortfarande är intresserad, men här är min första spike: https://github.com/olleharstedt/zen-...ket/socket.php

Förklaring:

1. Öppna en TCP-socket och lyssna på 127.0.0.1:777
2. Läs av __site i URLen
3. Kolla om __site har en file i site/ konfiguration (JSON)
4. Om ja, kolla typ
5. Om typ = search_engine, rippa formuläret
6. Skicka HTML till webbläsaren

Exempel på JSON:

HTML:
   {     "type": "search_engine",     "name": "Google",     "form_name": "f"  }
Exempel på HTML ser ut i webbläsaren:



Man kan lägga till lite CSS för att göra sidan mer presentabel (jämför http://bettermotherfuckingwebsite.com/).

För att skicka formuläret till programmet, gör om form method till GET istället för POST, och skicka alltid med __site=google.com som hidden input.

Fördelen med att göra en socket såhär är att man kan använda vilken webbläsare man vill, även en textbaserad, och att man inte behöver skriva en ny rendering engine.

Att göra:

1. Översätt till Java
2. Fixa OOP
3. En algortim behöver designas som kan gissa "page type", dvs. om sidan som hämtas är en sökmotor, artikel, länk lista, etc.
4. Om "page type" = artikel, använd Firefox reader view algoritm för att fånga main content.
5. Med mera, med mera :)
 

Attachments

Top