"Jakob Munck" <jm2_fjern_dette@webspeed.dk> skrev i en meddelelse
news:448fd37d$0$47074$edfadb0f@dread15.news.tele.dk...
> Jeg har en site med debat, hvor en del af brugerne har den vane at skrive
> deres indlæg i MS Word, og cut/paste det herfra direkte ind i formen til
> debatindlæg. Det medfører, at der kommer nogle skjulte karakterer med over
> og de skaber en masse uønskede liniebrud i teksten, som den ses af
> brugerne.
>
> ----------------------------------------
> //Sådan sættes teksten ind i mySql:
>
> $afsender_id = $_SESSION["medlem_id"];
> $emne = $_POST["emne"];
> $indhold = $_POST["indhold"];
>
> $emne = strip_tags($emne);
> $indhold = strip_tags($indhold);
>
> if(!get_magic_quotes_gpc()){
> $emne = addslashes($emne);
> $indhold = addslashes($indhold);
> }
>
> $dato_tid = date("Y-m-d G:i:s", time());
> $unixtid = date("U", time());
>
> mysql_query("INSERT INTO kadebat (afsender_id, emne, indhold, dato_tid,
> unixtid) VALUES ('$afsender_id', '$emne', '$indhold', '$dato_tid',
> '$unixtid')");
>
> ---------
>
> //Sådan hentes den ud på html-siden og præsenteres for brugerne:
>
>
> <?php echo nl2br($data["indhold"]); ?>
>
> -----------------------------
>
> Er der en kode-løsning på problemet, eller skal jeg bare lære brugerne at
> lagre deres indlæg fra diverse tekstbehandlingsprogrammer som ren tekst,
> inden de indsætter dem i debat-formen?
>
> v.h.
> Jakob
>
Hej
Jeg fandt dette stykke javascript kode i FCKeditor:
function CleanWord( html )
{
var bIgnoreFont = document.getElementById('chkRemoveFont').checked ;
var bRemoveStyles = document.getElementById('chkRemoveStyles').checked ;
html = html.replace(/<o:p>\s*<\/o:p>/g, "") ;
html = html.replace(/<o:p>.*?<\/o:p>/g, " ") ;
// Remove mso-xxx styles.
html = html.replace( /\s*mso-[^:]+:[^;"]+;?/gi, "" ) ;
// Remove margin styles.
html = html.replace( /\s*MARGIN: 0cm 0cm 0pt\s*;/gi, "" ) ;
html = html.replace( /\s*MARGIN: 0cm 0cm 0pt\s*"/gi, "\"" ) ;
html = html.replace( /\s*TEXT-INDENT: 0cm\s*;/gi, "" ) ;
html = html.replace( /\s*TEXT-INDENT: 0cm\s*"/gi, "\"" ) ;
html = html.replace( /\s*TEXT-ALIGN: [^\s;]+;?"/gi, "\"" ) ;
html = html.replace( /\s*PAGE-BREAK-BEFORE: [^\s;]+;?"/gi, "\"" ) ;
html = html.replace( /\s*FONT-VARIANT: [^\s;]+;?"/gi, "\"" ) ;
html = html.replace( /\s*tab-stops:[^;"]*;?/gi, "" ) ;
html = html.replace( /\s*tab-stops:[^"]*/gi, "" ) ;
// Remove FONT face attributes.
if ( bIgnoreFont )
{
html = html.replace( /\s*face="[^"]*"/gi, "" ) ;
html = html.replace( /\s*face=[^ >]*/gi, "" ) ;
html = html.replace( /\s*FONT-FAMILY:[^;"]*;?/gi, "" ) ;
}
// Remove Class attributes
html = html.replace(/<(\w[^>]*) class=([^ |>]*)([^>]*)/gi, "<$1$3") ;
// Remove styles.
if ( bRemoveStyles )
html = html.replace( /<(\w[^>]*) style="([^\"]*)"([^>]*)/gi, "<$1$3" ) ;
// Remove empty styles.
html = html.replace( /\s*style="\s*"/gi, '' ) ;
html = html.replace( /<SPAN\s*[^>]*>\s* \s*<\/SPAN>/gi, ' ' ) ;
html = html.replace( /<SPAN\s*[^>]*><\/SPAN>/gi, '' ) ;
// Remove Lang attributes
html = html.replace(/<(\w[^>]*) lang=([^ |>]*)([^>]*)/gi, "<$1$3") ;
html = html.replace( /<SPAN\s*>(.*?)<\/SPAN>/gi, '$1' ) ;
html = html.replace( /<FONT\s*>(.*?)<\/FONT>/gi, '$1' ) ;
// Remove XML elements and declarations
html = html.replace(/<\\?\?xml[^>]*>/gi, "") ;
// Remove Tags with XML namespace declarations: <o:p><\/o:p>
html = html.replace(/<\/?\w+:[^>]*>/gi, "") ;
html = html.replace( /<H\d>\s*<\/H\d>/gi, '' ) ;
html = html.replace( /<H1([^>]*)>/gi, '<div$1><b><font size="6">' ) ;
html = html.replace( /<H2([^>]*)>/gi, '<div$1><b><font size="5">' ) ;
html = html.replace( /<H3([^>]*)>/gi, '<div$1><b><font size="4">' ) ;
html = html.replace( /<H4([^>]*)>/gi, '<div$1><b><font size="3">' ) ;
html = html.replace( /<H5([^>]*)>/gi, '<div$1><b><font size="2">' ) ;
html = html.replace( /<H6([^>]*)>/gi, '<div$1><b><font size="1">' ) ;
html = html.replace( /<\/H\d>/gi, '<\/font><\/b><\/div>' ) ;
html = html.replace( /<(U|I|STRIKE)> <\/\1>/g, ' ' ) ;
// Remove empty tags (three times, just to be sure).
html = html.replace( /<([^\s>]+)[^>]*>\s*<\/\1>/g, '' ) ;
html = html.replace( /<([^\s>]+)[^>]*>\s*<\/\1>/g, '' ) ;
html = html.replace( /<([^\s>]+)[^>]*>\s*<\/\1>/g, '' ) ;
// Transform <P> to <DIV>
var re = new RegExp("(<P)([^>]*>.*?)(<\/P>)","gi") ; // Different because
of a IE 5.0 error
html = html.replace( re, "<div$2<\/div>" ) ;
return html ;
}
Håber du kan bruge noget af det
Mvh.
Rune